CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تبدیل متن محاوره ای فارسی به کمک N_gram ها

عنوان مقاله: تبدیل متن محاوره ای فارسی به کمک N_gram ها
شناسه ملی مقاله: CSICC16_078
منتشر شده در شانزدهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1389
مشخصات نویسندگان مقاله:

نادیه آرمین - آزمایشگاه پردازش زبان طبیعی،گروه مهندسی کامپیوتر،دانشکده مهندسی ب
مهرنوش شمس فرد - استادیار،آزمایشگاه پردازش زبان طبیعی،گروه مهندسی کامپیوتر،دانشکده

خلاصه مقاله:
با افزایش متون محاوره تبدیل متن محاوره ای به رسمی یکی از چالشهای موجوددر پردازش زبان است دراین مقاله به ارایه و آزمون راهکاری برای تبدیل متون محاوره ای به متون رسمی با استفاده از ترکیب روشهای مبتنی بر قاعده و مدلسازی آماری می پردازیم همچنین چگونگی ساخت پیکره نحوه توکن بندی و نحوه یافتن ریشه کلمات قوانین تبدیل کلمات محاوره ای به رسمی الگوریتم پیشنهادی و نحوه بکارگیری N_gram بیان میشود.

کلمات کلیدی:
پردازش زبان،متن محاوره،پیکره،N_gram

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/133822/