CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

آشکارساز گفتار جدید با استفاده از بازنمایی تنک و لغت نامه بهنگام

عنوان مقاله: آشکارساز گفتار جدید با استفاده از بازنمایی تنک و لغت نامه بهنگام
شناسه ملی مقاله: EESCONF05_052
منتشر شده در پنجمین کنفرانس بین المللی مهندسی برق، الکترونیک و شبکه های هوشمند در سال 1400
مشخصات نویسندگان مقاله:

محدثه اسحاقی - گروه مهندسی برق، واحد نوشهر، دانشگاه آزاد اسلامی ، نوشهر، ایران

خلاصه مقاله:
در این مقاله یک آشکارسازگفتار VAD بر مبنای بازنمایی تنک و بهنگامسازی اتم های لغت نامه در فضای اسپکتروگرام شنیداری (فضای دوبعدی STRF ) ارائه شده است. در این فضای طیفی زمانی در مرحله اول، طیف نگاره گفتار حاصل شده و در مرحله بعد، طیف نگاره گفتار شنیداری، به دوبعد مقیاس و نرخ تجزیه می شود در سال های اخیر روش تنک جایگاه ویژه ای در روش های پردازش گفتار یافته است، ایده اصلی در این روش، بازسازی هر سیگنال گفتار با استفاده از تعداد محدودی اتم های پایه است. استفاده از بازنمایی تنک در یادگیری لغت نامه های گفتار و نویز و بهنگام سازی آنها، باعث جداساز بهتر قسمت های گفتار ونویز می شود. در این الگوریتم با استفاده از فضای دو بعدی STRF و با کمک بازنمایی تنک، لغت نامه های بهنگام Dictionary updating با اندازه اتم های متفاوت حاصل شده که ازروش های یادگیری K-SVD و NMF برای آموزش آنها بهره می بریم. نتایج، حاکی از جواب دهی خوب این روش است، بطورمثال در ۵ SNR= عملکرد آشکارسار گفتار پیشنهادی برای نویز سفید برابر با۹۲.۷۱ % و در نویز ماشین برابر با ۹۱.۲۱ % می باشد. مقایسه نتایج پارامترهای ارزیابی NDS و MSC با روش های دیگر، عملکرد بهتر روش پیشنهادی را نشان می دهد.

کلمات کلیدی:
آشکارساز گفتار، اسپکتروگرام شنیداری، بازنمایی تنک، لغت نامه بهنگام

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1257207/