استخراج ویژگی های مقاوم گفتاری زیر باندی با استفاده از شبکه های درهم پیچش چند دقتی

سال انتشار: 1398
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 68

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_TJEE-49-3_037

تاریخ نمایه سازی: 27 تیر 1402

چکیده مقاله:

شبکه های عصبی درهم پیچش (CNN) به عنوان گروهی از شبکه های عصبی عمیق، در سال های اخیر کاربرد فراوانی در مدل سازی آکوستیک و همچنین استخراج ویژگی و مدل سازی توام در بازشناسی گفتار یافته اند. در مقاله حاضر، پیشنهاد می شود تا از CNN برای استخراج ویژگی مقاوم به نویز استفاده شود، درحالی که ورودی CNN طیف سیگنال گفتار نویزی و خروجی هدف آن خروجی های متناظر تمیز از بانک فیلتر مل است. به این ترتیب CNN ویژگی های مقاوم به نویز را از طیف سیگنال گفتار استخراج می نماید. نقطه ضعف CNN در این روش آن است که تنها یک وضوح فرکانسی ثابت را به کار می گیرد. ازاین جهت، در این مقاله استفاده از چند شبکه عصبی درهم پیچش با اندازه های فیلتر درهم پیچش متفاوت، جهت مدل سازی تفاوت وضوح فرکانسی برای استخراج ویژگی از طیف سیگنال گفتار پیشنهاد می شود. روش پیشنهادی را شبکه عصبی درهم پیچش چند دقتی (MRCNN) نام گذاری کرده ایم. آزمایش ها روی دادگان Aurora۲ نشان می دهند که CNN نسبت به شبکه باور عمیق در استخراج ویژگی مقاوم به نویز میانگین دقت بازشناسی را ۲۰ درصد بهبود می دهد. همچنین نتایج نشان می دهند که MRCNN میانگین دقت بازشناسی را نسبت به شبکه عصبی درهم پیچش استاندارد (تک دقتی) ۱ درصد بهبود می دهد.

کلیدواژه ها:

نویسندگان

نوید نادری

دانشکده مهندسی کامپیوتر - دانشگاه صنعتی خواجه نصیرالدین طوسی

بابک ناصر شریف

دانشکده مهندسی کامپیوتر - دانشگاه صنعتی خواجه نصیرالدین طوسی

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • فائزه بنی اردلان، احمد اکبری، بابک ناصرشریف، «حذف نویز و ...
  • مجتبی غلامی پور، بابک ناصرشریف، «مقاوم سازی ویژگی های مل ...
  • مجتبی حاجی آبادی، عباس ابراهیمی مقدم، حسین خوش بین، «حذف ...
  • مسعود گراوانچی زاده، ساناز قائمی سردرودی، «بهبود کیفیت گفتار مبتنی ...
  • O. Abdel-Hamid, A. r. Mohamed, H. Jiang, L. Deng, G. ...
  • S. Ikbal and H., Bourlard, "Phase autocorrelation derived robust speech ...
  • K. Han, Y. He, D. Bagchi, E. Fosler-Lussier and D. ...
  • O. Abdel-Hamid, A. r. Mohamed, H. Jiang and G. Penn, ...
  • J. Du, Q. Wang, T. Gao, Y. Xu, L. Dai ...
  • X. Feng, Y. Zhang and J. Glass. "Speech feature denoising ...
  • A. Mohamed, G.E. Dahl and G. Hinton, “Acoustic Modeling Using ...
  • T. N. Sainath, A.-r. Mohamed, B. Kingsbury and B. Ramabhadran, ...
  • O. Abdel-Hamid, L. Deng and D. Yu, "Exploring convolutional neural ...
  • J.-T. Huang, J. Li and Y. Gong, "An analysis of ...
  • D. Palaz,, R. Collobert and M. Magimai Doss, "Estimating phoneme ...
  • D. Palaz, M. M. Doss and R. Collobert, "Convolutional Neural ...
  • D. Palaz, and R. Collobert, "Analysis of cnn-based speech recognition ...
  • T. N. Sainath, B. Kingsbury, G. Saon, H. Soltau, A.-r. ...
  • Y. Takashima, T. Nakashika, T. Takiguchi and Y. Ariki, "Feature ...
  • A. Lozano-Diez, R. Zazo-Candil, J. Gonzalez-Dominguez, D. T. Toledano and ...
  • S. Thomas, S. Ganapathy, G. Saon and H. Soltau, "Analyzing ...
  • R. Yeh, M. Hasegawa-Johnson and M. N. Do, "Stable and ...
  • T. N. Sainath, O. Vinyals, A. Senior and H. Sak, ...
  • T. N. Sainath, R. J. Weiss, A. Senior, K. W. ...
  • T. N. Sainath, B. Kingsbury, A.-r. Mohamed and B. Ramabhadran, ...
  • T. N. Sainath, B. Kingsbury, A.-r. Mohamed, G. E. Dahl, ...
  • Y. Zhao, X. Jin, X. Hu, "Recurrent convolutional neural network ...
  • Y. Zhang, W. Chan, N. Jaitly, "Very deep convolutional networks ...
  • K. Choi, G. Fazekas, M. Sandler, K.Cho, "Convolutional recurrent neural ...
  • Y. Qian, M. Bi, T. Tan and K. Yu, "Very ...
  • W. Dai, C. Dai, S. Qu, J. Li, S. Dos, ...
  • H.-G. Hirsch and D. Pearce, "The Aurora experimental framework for ...
  • A. Agarwal, E. Akchurin, et al., "An Introduction to Computational ...
  • نمایش کامل مراجع