آشکارسازی فعالیت گفتاری به کمکبهسازی گفتار و استفاده از دیورژانسطیفی بلند مدت سیگنال

سال انتشار: 1384
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,323

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI11_046

تاریخ نمایه سازی: 5 آذر 1390

چکیده مقاله:

در این مقاله طرح یک آشکارساز فعالیت گفتاری جدید که می تواند در شرایط محیط ِ ی نامناسب با نویز غیر ایستا و نسبت سیگنال به نویز پایین کار کند مورد بررسی قرار می گیرد. امروزه در بسیاری از کاربردهای پردازش گفتار همانند وسایل کمک شنوایی، بازشناسی گفتار، کدینگ و ... برای کاهش تأثیر مخرب نویز بر عملکرد سیستم از سیستم های بهسازی گفتار استفاده می شود. در این سیستم ها معمو ً لا از آشکارساز فعالیت گفتاری(Voice Activity Detector برای تشخیص فریم های فاقد گفتار و سپس تخمین طیف نویز از روی آنها استفاده می شود. در این تحقیق از یک سیستم بهسازی گفتار پیش از بکارگیری VAD استفاده شده و خروجی VAD مجددًا در همین سیستم بکارگرفته می شود. در این راستا از سیستم بهسازی گفتار Malah و Ephraim برای تخمین MMSE طیف سیگنال و افزایش نسبت سیگنال به نویز در سیگنال ورودی استفاده شده است. سپس معیار تصمیم گیری VAD از محاسبه دیورژانس طیفی بلندمدت سیگنال ارتقا یافته Enhanced Long Term Spectral (Divergence- E-LTSD بدست می آید. نشان داده شده است که استفاده از اطلاعات بلند مدت طیف سیگنال در بهبود عملکرد VAD موثر است. سپس برای اینکه سیستم بهسازی گفتار بتواند در شرایط محیط ِ ی نامناسب با نویز غیر ایستا کار کند، طیف نویز را در فریم های فاقد گفتار به روز می کنیم

نویسندگان

علیرضا اسماعیلی

دانشکده مهندسی برق، دانشگاه صنعتی امیرکبیر