CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

استخراج و پیاده سازی مدل آماری برای اتصال واجهای فارسی

عنوان مقاله: استخراج و پیاده سازی مدل آماری برای اتصال واجهای فارسی
شناسه ملی مقاله: ISCEE04_037
منتشر شده در چهارمین کنفرانس دانشجویی مهندسی برق ایران در سال 1380
مشخصات نویسندگان مقاله:

محمد محمودی قیداری - دانشکده مهندسی کامپیوتر دانشگاه صنعتی شریف
امین کرباسی - آزمایشگاه پردازش اطلاعات دانشکده مهندسی برق دانشگاه صنعتی امیرکبیر
فربد رزازی - آزمایشگاه پردازش اطلاعات دانشکده مهندسی برق دانشگاه صنعتی امیرکبیر

خلاصه مقاله:
دراین مقاله مدلی آماری برای دنباله های فونتیکی گفتار فارسی ارائه شده است با توجه به اینکه در زبان فارسی به مدلسازی زبانی کمتر پرداخته شدهاست اینم وضوع می تواند به کاهش احتمال خطای سیستم های بارشناسی کمک شایانی کند مبنای این مدلسازی مدل n-gram با روش هموارسازی درون یابی بوده است سیستم پیاده سازی شده برای مدلهای 1-gram,2-gram,3-gram,4-gram آزموده شده است و بهترین نتیجه برای 4-gram با هموارسازی درون یابی به ازای ضریب ثابت 0/9 بدست آمده است که کمترین پیچیدگی 3.73 به دست آمده است.

کلمات کلیدی:
بازشناسی گفتار، NLP، مدلسازی زبانی، مدل n-gram، هموارسازی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/127962/