استفاده از شبکه های عصبی محاسبه گرم خزنی به منظور بازشناسی گفتار فارسی

زهره, انصاری; آزاده, شیرودی; سیدعلی, صالحی

استفاده از شبکه های عصبی محاسبه گرم خزنی به منظور بازشناسی گفتار فارسی

عنوان مقاله: استفاده از شبکه های عصبی محاسبه گرم خزنی به منظور بازشناسی گفتار فارسی
شناسه ملی مقاله: ICBME22_022
منتشر شده در بیست و دومین کنفرانس مهندسی زیست پزشکی ایران در سال 1394

مشخصات نویسندگان مقاله:

زهره انصاری - دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار
آزاده شیرودی - دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار
سیدعلی صالحی - دانشگاه صنعتی امیرکبیر، دانشکده مهندسی پزشکی، آزمایشگاه پردازش گفتار

خلاصه مقاله:

شبکه های عصبی بازگشتی مدل های دینامیکی قدرتمندی به منظور نگاشت دنباله ای از ورودی ها به دنباله ای از خروجی ها مانند آنچه در بازشناسی گفتار انجام می گیرد هستند. اتصالات بازگشتی موجود در این ساختار از شبکه ها آنها را برای مدل کردن توالی های زمانی گفتاری مثل توالی بردارهای ویژگی گفتاری مناسب ساخته است. اما مشکلی که در تعلیم این ساختار از شبکه ها وجود دارد، ناپدید شدن گرادیان است. به بیانی دیگر، با تعلیم آنها به کمک روش- های متداول تعلیم شبکه های عصبی بازگشتی، نمی توان از اطلاعات فریم های با فاصله بیشتر از ده گام زمانی برای تصمیم گیری در مورد فریم فعلی کمک گرفت. در واقع، شبکه با گذشت زمان ورودی اولیه را فراموش کرده است. برای حل این مشکل، شبکه های عصبی محاسبه گر مخزنی معرفی شده اند. نتایج آزمایش های بازشناسی گفتار انجام شده با استفاده از این ساختار از شبکه ها کارایی این ساختارها را بخوبی آشکار کرده است. در این مقاله تاثیر استفاده از شبکه های عصبی محاسبه گر مخزنی بر روی دادگان گفتاری فارسی فارس دات به منظور بازشناسی گفتار مورد بررسی قرار گرفته است. نتایج آزمایشات انجام گرفته نشان می دهند که با بهینه سازی پارامترهای مربوط به این شبکه ها بر روی دادگان فارسی، میتوان به دقت بازشناسی واج برابر با 67/7% با زمان تعلیم و هزینه محاسباتی بسیار کمتری نسبت به شبکه های عصبی بازگشتی متداول دست یافت

کلمات کلیدی:

شبکه های عصبی بازگشتی، شبکه های محاسبه گر مخزنی، بازشناسی گفتار

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/698249/