استفاده از شبکه های عصبی محاسبه گرم خزنی به منظور بازشناسی گفتار فارسی

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 389

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICBME22_022

تاریخ نمایه سازی: 7 اسفند 1396

چکیده مقاله:

شبکه های عصبی بازگشتی مدل های دینامیکی قدرتمندی به منظور نگاشت دنباله ای از ورودی ها به دنباله ای از خروجی ها مانند آنچه در بازشناسی گفتار انجام می گیرد هستند. اتصالات بازگشتی موجود در این ساختار از شبکه ها آنها را برای مدل کردن توالی های زمانی گفتاری مثل توالی بردارهای ویژگی گفتاری مناسب ساخته است. اما مشکلی که در تعلیم این ساختار از شبکه ها وجود دارد، ناپدید شدن گرادیان است. به بیانی دیگر، با تعلیم آنها به کمک روش- های متداول تعلیم شبکه های عصبی بازگشتی، نمی توان از اطلاعات فریم های با فاصله بیشتر از ده گام زمانی برای تصمیم گیری در مورد فریم فعلی کمک گرفت. در واقع، شبکه با گذشت زمان ورودی اولیه را فراموش کرده است. برای حل این مشکل، شبکه های عصبی محاسبه گر مخزنی معرفی شده اند. نتایج آزمایش های بازشناسی گفتار انجام شده با استفاده از این ساختار از شبکه ها کارایی این ساختارها را بخوبی آشکار کرده است. در این مقاله تاثیر استفاده از شبکه های عصبی محاسبه گر مخزنی بر روی دادگان گفتاری فارسی فارس دات به منظور بازشناسی گفتار مورد بررسی قرار گرفته است. نتایج آزمایشات انجام گرفته نشان می دهند که با بهینه سازی پارامترهای مربوط به این شبکه ها بر روی دادگان فارسی، میتوان به دقت بازشناسی واج برابر با 67/7% با زمان تعلیم و هزینه محاسباتی بسیار کمتری نسبت به شبکه های عصبی بازگشتی متداول دست یافت

کلیدواژه ها:

شبکه های عصبی بازگشتی ، شبکه های محاسبه گر مخزنی ، بازشناسی گفتار

نویسندگان

زهره انصاری

دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار

آزاده شیرودی

دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار

سیدعلی صالحی

دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار