روشی جدید برای استخراج ویژگی صحبت مبتنی بر استفاده از ویژگی طیفی دلتا و Invariant-integration

حسن فرسی

روشی جدید برای استخراج ویژگی صحبت مبتنی بر استفاده از ویژگی طیفی دلتا و Invariant-integration

محل انتشار: اولین کنفرانس ملی فناوری های نوین در علوم مهندسی

سال انتشار: 1395

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 358

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/592533

شناسه ملی سند علمی:

FANAVARI01_004

تاریخ نمایه سازی: 19 خرداد 1396

چکیده مقاله:

در این مقاله یک الگوریتم استخراج ویژگی جدید مقاوم به نویز را پیشنهاد می دهیم. در این الگوریتم استخراج ویژگی از یک فیلتر غیرخطی و پوشش موقتی استفاده می کنیم و با بهره گیری از ویژگی دلتا- طیفی بجای ویژگی دلتا- کپسترال دقت بازشناسی صحبت را بطور مطلوبی افزایش می دهیم. تقریبا همه ی سیستم های ASR کنونی از ویژگی های کپسترال دلتا و دلتا-دلتا برای استخراج ویژگی صحبت استفاده می کنند. از جمله عواملی غیرمحیطی که باعث کاهش دقت بازشناسی می شود می توان به vocal-tract length اشاره کرد که منجر به عدم تطبیق میان داده ی training و testing می شود. برای کاهش تاثیرات VTL می توان از ایده ی IIF استفاده نمود. در این مقاله هدف، رسیدن به ویژگی های مقاومی است که علاوه بر اینکه در شرایط مختلف نویزی بهبودهایی را فراهم کند در مقابل تغییرات تاثیرات VTL نیز مقاوم باشد. نتایج نشان می دهد که دقت بازشناسی در مقایسه با MFCC و PLP در حضور انواع مختلفی از نویز و همچنین در دو سناریوی مختلف VTL بهبود یافته است.

کلیدواژه ها:

بازشناسی صحبت ، vocal-tract length ، پوشش موقتی ، فیلتر غیرخطی نامتقارن ، ویژگی های کپسترال دلتا ، Invariant-integration

نویسندگان

حسن فرسی

دانشکده مهندسی، دانشگاه آزاد واحد بیرجند

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

_ _ _ _ _ for automatic speaker identificatio and ...
Y. Obuchi, N. Hataoka, and R. M. Stern, "Normalization of ...
P. J. Moreno, B. Raj, and R. M. Stern, _ ...
R. M. Stern, B. Raj, and P. J. Moreno, "Compensation ...
C. Kim and R. M Stern, "Power function-based power distribution ...
_ _ _ _ music on _ in Proc. IEEE ...
B. Raj and R. M. Stern, _ _ issing-Feature Methods ...
H. Hermansky, "Perceptual linear prediction analysis of speech, " J. ...
M. Bijankhan J. Sheikhzadegan, "FARSTDAT - The Speech Database of ...

نمایش کامل مراجع