آشکارسازی فعالیت گفتاری به کمکبهسازی گفتار و استفاده از دیورژانسطیفی بلند مدت سیگنال
محل انتشار: یازدهمین کنفرانس سالانه انجمن کامپیوتر ایران
سال انتشار: 1384
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,323
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI11_046
تاریخ نمایه سازی: 5 آذر 1390
چکیده مقاله:
در این مقاله طرح یک آشکارساز فعالیت گفتاری جدید که می تواند در شرایط محیط ِ ی نامناسب با نویز غیر ایستا و نسبت سیگنال به نویز پایین کار کند مورد بررسی قرار می گیرد. امروزه در بسیاری از کاربردهای پردازش گفتار همانند وسایل کمک شنوایی، بازشناسی گفتار، کدینگ و ... برای کاهش تأثیر مخرب نویز بر عملکرد سیستم از سیستم های بهسازی گفتار استفاده می شود. در این سیستم ها معمو ً لا از آشکارساز فعالیت گفتاری(Voice Activity Detector برای تشخیص فریم های فاقد گفتار و سپس تخمین طیف نویز از روی آنها استفاده می شود. در این تحقیق از یک سیستم بهسازی گفتار پیش از بکارگیری VAD استفاده شده و خروجی VAD مجددًا در همین سیستم بکارگرفته می شود. در این راستا از سیستم بهسازی گفتار Malah و Ephraim برای تخمین MMSE طیف سیگنال و افزایش نسبت سیگنال به نویز در سیگنال ورودی استفاده شده است. سپس معیار تصمیم گیری VAD از محاسبه دیورژانس طیفی بلندمدت سیگنال ارتقا یافته Enhanced Long Term Spectral (Divergence- E-LTSD بدست می آید. نشان داده شده است که استفاده از اطلاعات بلند مدت طیف سیگنال در بهبود عملکرد VAD موثر است. سپس برای اینکه سیستم بهسازی گفتار بتواند در شرایط محیط ِ ی نامناسب با نویز غیر ایستا کار کند، طیف نویز را در فریم های فاقد گفتار به روز می کنیم
کلیدواژه ها:
نویسندگان