بازشناسی گفتار پیوسته فارسی بر مبنای مدل سازی وقایع گسسته صوتی

سال انتشار: 1380
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,741

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICBME10_005

تاریخ نمایه سازی: 20 خرداد 1387

چکیده مقاله:

در اینجا یک مدل وقایع گسسته برای بازشناسی گفتار پیوسته فارسی مستقل از گوینده ارائه شده است. در این مدل شبکه عصبی جلو سری با تأخیر زمانی TDNN با دو لایه پنهان برای بازشناسی وقایع صوتی سیگنال گفتار تعلیم داده شده است. وقایع (events)، اتفاقات گذرا و لحظه ای خاصی هستند که در سیگنال صحبت رخ می دهند و حاوی اطلاعات قابل توجهی می باشند. در تعریف آنها از تجربیات زیست شناختی و عصب شناختی شنوایی و همچنین اطلاعات زبانشناختی و بررسی نحوه تولید آواهای زبان فارسی استفاده شده است. علاوه بر آن با تحلیل خطاهای سیستم های بازشناسی بر پایه فریم و یا بر پایه بازشناسی مرز واج‌ها و انجام آزمایشات ریاضی مختلف بر روی پارامترها سعی شده کلاس‌های مختلف وقایع به گونه‌ای معرفی شوند که بیانگر نواحی گذرا و سریع سیگنال باشند و تناقضات موجود در نحوه برچسب دهی واحدها که مانع از یادگیری کامل شبکه ها می شدند را نیز برطرف کنند. در آزمایش از دادگان فارس دات و پارامترهای LHCB استفاده شده است و میزان صحت شناسایی وقایع توسط برنامه استاندارد NIST استخارج شده که نتایج در مقایسه با سایر روشها امیدوار کننده است.

نویسندگان

مریم یزدان

کارشناس ارشد بویالکتریک، استادیار

سیدعلی سیدصالحی

استادیار دانشگاه صنعتی امیرکبیر، مهندسی پزشکی مرکز تحقیقات پر

محمود بیجن خان

دانشگاه تهران، گروه زبانشناسی

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • _ سید صالحی، مسزن4، و همکاران، ارزیابی عملکرد شبکه های ...
  • _ کرمی، ش، به کارگیری اطلاعات موجو: در نواحی گذرای ...
  • MesulanmM. H.. _ .Sersatiomh to Cogritior ", Brain1 998), _ ...
  • Meister, M., Berry, M .J."The Neral code of the _ ...
  • Morgan , N. et all. _ "Sftochastic Perceptual _ _ ...
  • Niyogi, P."A _، rarework fo Loctirng Phoretice Evexts" , ICsSLP ...
  • Seyyed Salehi, S.A.."A Nearal Network Speech Recogrition Based ow the ...
  • Stevens, K.N ."Frorm 4casstic Ces _ Segmert , Feature, Words" ...
  • Stevens.K. N _ _ _ 'Jmplem _ of a :Model ...
  • Vallenstein , G.V.etall, "T"e _ _ _ _ of Disc ...
  • نمایش کامل مراجع