شکل دهنده پرتو MVDR مرتبه کسری و مبتنی بر آنالیز مقادیر ویژه برای بهسازی گفتار

سال انتشار: 1402
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 151

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_TJEE-53-1_004

تاریخ نمایه سازی: 9 اردیبهشت 1402

چکیده مقاله:

یکی از پرکاربردترین الگوریتم های شکل دهی پرتو در بهسازی گفتار، الگوریتم حداقل واریانس بدون اعوجاج است. در محاسبه ضرائب این شکل دهنده فرض ناهمبسته بودن نویز و سیگنال مطلوب با توجه به وجود پژواک و نویزهای با طیفی مشابه سیگنال مطلوب برقرار نیست. در نتیجه، ماتریس های کواریانس و به تبع آن، ضرائب شکل دهنده دارای دقت کافی نخواهد بود. در این مقاله، به عنوان اولین تغییر در شکل دهنده پرتو حداقل واریانس، با اعمال آنالیز مقادیر ویژه به ماتریس کواریانس سیگنال مطلوب و حذف مقادیر ویژه کوچک، دقت ضرائب شکل دهنده بهبود داده می شود. در دومین تغییر، از تبدیل فوریه مرتبه کسری به عنوان حالت تعمیم یافته تبدیل فوریه استاندارد استفاده شده است. در ادامه تغییرات پیشنهادی فرمول بندی شده و با بدست آوردن پارامتر بهینه تبدیل فوریه کسری به صورت تجربی، اثر هریک از دو تغییر با روشهای پایه مقایسه می شود. نتایج نشان می دهد که روش های پیشنهادی ضمن پایداری نسبت به تغییر پارامترها و شرایط محیطی، در سناریوهای مختلف به نسبت توان سیگنال به نویزی بین  تا  دست می یابند. در مقابل، روش پایه عملکردی در محدوده  تا  دارد. همچنین اگرچه هریک از تغییرات فوق به تنهایی نیز منجر به بهبود کارایی می شوند، اما بهترین عملکرد در حالتی بدست می آید که هر دو تغییر پیشنهادی با هم اعمال شود.

کلیدواژه ها:

بهسازی گفتار ، آرایه میکروفونی ، آنالیز مقادیر ویژه ، تبدیل فوریه زمان-کوتاه کسری

نویسندگان

سید مصطفی علویان شهری

دانشجوی دکتری، دانشکده مهندسی برق، دانشگاه یزد، یزد، ایران

حمیدرضا ابوطالبی

استاد، دانشکده مهندسی برق، دانشگاه یزد، یزد، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • E. A. P. Habets, J. Benesty, I. Cohen, S. Gannot, ...
  • S. Zhang and X. Li, “Microphone array generalization for multichannel ...
  • آوید آوخ، حمیدرضا ابوطالبی «بهسازی وفقی سیگنال گفتار در محیط ...
  • امیرحسین حاج احمدی، محمد مهدی همایون پور، «بهسازی گفتار دومرحله ...
  • J. Benesty, J. Chen, and E. A. P. Habets, Speech ...
  • N. Yazdi and K.Todros, “Measure-transformed MVDR beamformeang” IEEE Signal Process. ...
  • D. Ying and Y. Yan, “Robust and fast localization of ...
  • V. W. Neo, C. Evers, and P. A. Naylor, “PEVD-based ...
  • V. W. Neo, C. Evers, and P. A. Naylor, “Enhancement ...
  • J. Shi, J. Zheng, X. Liu, W. Xiang, and Q. ...
  • I. S. Yetik and A. Nehorai, “Beamforming using the fractional ...
  • S. Das and I. Pan, Fractional order signal processing: introductory ...
  • J. Yin, K. Guo, X. Han, and G. Yu, “Fractional ...
  • E. A. P. Habets, “Room impulse response (RIR) generator,” May ...
  • J. S. Garofolo et al., “TIMIT acoustic phonetic continuous speech ...
  • A. W. Rix, J. G. Beerends, M. P. Hollier, and ...
  • S. Yook et al., “Modified segmental signal-to-noise ratio reflecting spectral ...
  • Z. Wang, E. Vicent, R. Serizel, and Y. Yan., “Rank-۱ ...
  • نمایش کامل مراجع