روشی جدید برای استخراج ویژگی صحبت مبتنی بر استفاده از ویژگی طیفی دلتا و Invariant-integration
محل انتشار: اولین کنفرانس ملی فناوری های نوین در علوم مهندسی
سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 358
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
FANAVARI01_004
تاریخ نمایه سازی: 19 خرداد 1396
چکیده مقاله:
در این مقاله یک الگوریتم استخراج ویژگی جدید مقاوم به نویز را پیشنهاد می دهیم. در این الگوریتم استخراج ویژگی از یک فیلتر غیرخطی و پوشش موقتی استفاده می کنیم و با بهره گیری از ویژگی دلتا- طیفی بجای ویژگی دلتا- کپسترال دقت بازشناسی صحبت را بطور مطلوبی افزایش می دهیم. تقریبا همه ی سیستم های ASR کنونی از ویژگی های کپسترال دلتا و دلتا-دلتا برای استخراج ویژگی صحبت استفاده می کنند. از جمله عواملی غیرمحیطی که باعث کاهش دقت بازشناسی می شود می توان به vocal-tract length اشاره کرد که منجر به عدم تطبیق میان داده ی training و testing می شود. برای کاهش تاثیرات VTL می توان از ایده ی IIF استفاده نمود. در این مقاله هدف، رسیدن به ویژگی های مقاومی است که علاوه بر اینکه در شرایط مختلف نویزی بهبودهایی را فراهم کند در مقابل تغییرات تاثیرات VTL نیز مقاوم باشد. نتایج نشان می دهد که دقت بازشناسی در مقایسه با MFCC و PLP در حضور انواع مختلفی از نویز و همچنین در دو سناریوی مختلف VTL بهبود یافته است.
کلیدواژه ها:
بازشناسی صحبت ، vocal-tract length ، پوشش موقتی ، فیلتر غیرخطی نامتقارن ، ویژگی های کپسترال دلتا ، Invariant-integration
نویسندگان
حسن فرسی
دانشکده مهندسی، دانشگاه آزاد واحد بیرجند
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :