CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تشخیص متون محاوره از رسمی با روش های آماری

عنوان مقاله: تشخیص متون محاوره از رسمی با روش های آماری
شناسه ملی مقاله: ARGCONF03_016
منتشر شده در سومین کنفرانس سالانه ملی مهندسی برق، کامپیوتر و بیو الکتریک ایران در سال 1397
مشخصات نویسندگان مقاله:

محمد محسن خازنی - کارشناس مهندسی کامپیوتر، دانشگاه علم و صنعت ایران
عین الله خنجری - دانشیار، دانشگاه علم و صنعت ایران
احمد اکبری - کارشناس ارشد هوش مصنوعی، آزمایشگاه پردازش متن شرکت آرمان رایان شریف

خلاصه مقاله:
با رایج شدن ارتباطات مجازی و رشد استفاده از شبکه های اجتماعی، حجم دادگان متنی محاوره ر شد شدیدی دا شته ا ست به طوری که چشم پوشی از این منابع غنی برای متن کاوی امری محال است. با توجه به این که اکثر ابزار های تحلیل تحلیل و بررسی پردازش زیان طبیعی برای متون رسمی قابل استفاده هستند، پیش از هر پردازشی باید این متون محاوره از رسمی جدا شوند تا به فرم استاندارد رسمی خود تبدیل شوند. در این مقاله مدلی جهت تشخیص متون محاوره از ر سمی با ترکیب روش آماری و د ستوری ارایه می شود. از آن جا که دقت روش های آماری محور، به پیکره های مورد استفاده وابسته است، نیاز به دادگان معتبر و گسترده ای وجود دارد. تمام متون و پیکره های مورد ا ستفاده و روش ساخت آن ها در این مقاله تو صیف شده و الگوریتمی برای تشخیص متون محاوره از رسمی ارایه شده است. دقت F به دست آماده الگوریتم با استفاده از پیکره های توصیفی 05,96 است.

کلمات کلیدی:
تشخیص متن محاوره، تشخیص متن رسمی، روش آماری، شبکه های اجتماعی، پردازش زبان طبیعی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/754151/