CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

آشکارساز گفتار جدید با استفاده از بازنمایی تنک و لغت نامه بهنگام در فضای طیفی زمانی

عنوان مقاله: آشکارساز گفتار جدید با استفاده از بازنمایی تنک و لغت نامه بهنگام در فضای طیفی زمانی
شناسه ملی مقاله: EESCONF05_051
منتشر شده در پنجمین کنفرانس بین المللی مهندسی برق، الکترونیک و شبکه های هوشمند در سال 1400
مشخصات نویسندگان مقاله:

محدثه اسحاقی - گروه مهندسی برق، واحد نوشهر، دانشگاه آزاد اسلامی ، نوشهر، ایران

خلاصه مقاله:
در این مقاله یک الگوریتم برای آشکارسازگفتار VAD بر مبنای بازنمایی تنک و بهنگام سازی اتم های لغت نامه در فضای طیفی زمانی STRF ارائه شده است. مولفه های فضای طیفی زمانی علاوه بر ابعاد فرکانس و زمان، دارای دو بعد دیگر مقیاس و نرخ هستند. مقیاس به معنای مدولاسیون طیفی و نرخ به معنای مدولاسیون زمانی است. از سوی دیگر، استفاده از بازنمایی تنک در یادگیری لغت نامه های گفتار و نویز و بهنگام سازی آنها ، باعث جداساز بهتر قسمت های گفتار ونویز می شود. در این الگوریتم ابتدا گفتار ورودی با استفاده از فضای STRF به مولفه های جهاربعدی فرکانس، زمان، مقیاس و نرخ تبدیل می شود و از آنجایی که تشکیل یک لغت نامه مطلوب با این تعداد مولفه تقریبا غیر ممکن است. برای رفع این مشکل افراز مکعبی هرقاب زمانی مد نظر قرار گرفت. سپس به کمک روش تنک و لغت نامه های بهنگام Dictionary updating گفتار و نویز در هر مکعب، قسمت های گفتار و غیرگفتار سیگنال ورودی از هم جدا می شود. در اینجا از الگوریتم NMF برای آموزش لغت نامه بهره می بریم. بطورمثال نتایج در SNR های کمتر از ۰ عملکرد آشکارسار گفتار پیشنهادی برای نویر سفید و ماشین بیشتر از ۹۲% و ۹۵ % می باشد که عملکرد بهتر آشکارساز گفتار پیشنهادی نسبت به سایر روش ها را نشان می دهد

کلمات کلیدی:
آشکارساز گفتار، فضای طیفی زمانی، بازنمایی تنک، الگوریتم - NMF

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1257206/