پیشنهاد یک روش آشکارساز صوت دو مرحله ای مبتنی بر مدل مخفی مارکوف

محمد مهدی فارسی نژاد; بهزاد زمانی دهکردی; احمد اکبری; بابک ناصر شریف

پیشنهاد یک روش آشکارساز صوت دو مرحله ای مبتنی بر مدل مخفی مارکوف

محل انتشار: چهاردهمین کنفرانس سالانه انجمن کامپیوتر ایران

سال انتشار: 1387

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 2,066

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/60961

شناسه ملی سند علمی:

ACCSI14_213

تاریخ نمایه سازی: 26 مهر 1387

چکیده مقاله:

آشکارساز صوت (Voice Activity Detection)ابزار مهمی برای افزایش کارائی روش های کد کردن گفتار، بهبود کیفیت گفتار و بازشناسی گفتار محسوب می شود. آشکارسازها به روش های آستانه گذاری و روشهای مبتنی بر مدل تقسیم می شوند. روش های آستانه گذاری کارائی ضعیفی در محیط نویزی دارند. از اینرو در مقاله حاضر یک الگوریتم VAD مبتنی بر مدل مخفی مارکوف پیشنهاد شده است که در دو مرحله عمل می کند. نخست با یک دسته بند (مدل مخفی مارکوف)، نوع نویز تشخیص داده می شود. در مرحله دوم، آشکارساز صوت مرتبط با آن نویز بکار می رود تا عملکرد بالاتری در محیط نویزی داشته باشد . ویژگی های مورد استفاده در این روش، بردار ۳۹ بعدی شامل لگاریتم انرژی، ۱۲ ضریب MFCC و مشتقات مرتبه اول و دوم آنها می باشد عملکرد الگوریتم پیشنهادی بر روی دادگان TIMIT مورد ارزیابی قرار گرفته است. بر اساس نتایج بدست آمده روش پیشنهادی نسبت به روش های دیگر عملکرد قابل قبولی از خود نشان داده است.

کلیدواژه ها:

آشکارساز صوت ، مدل مخفی مارکوف ، تشخیص دهنده نوع نویز ، استخراج ویژگی ، آستانه گذاری

نویسندگان

محمد مهدی فارسی نژاد

آزمایشگاه پردازش صدا و گفتار، دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران

بهزاد زمانی دهکردی

آزمایشگاه پردازش صدا و گفتار، دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران

احمد اکبری

آزمایشگاه پردازش صدا و گفتار، دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران

بابک ناصر شریف

گروه مهندسی کامپیوتر، دانشکده فنی، دانشگاه گیلان

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

سلیمانی سیده اکرم، احدی سیدمحمد، ، آشکارسازی فعالیت گفتاری با ...
Sohn J., Kim N. S. and Sung W., ،0A statistical ...
Mohammdi M., Nasersharif B., Rahmani M. and Akbari A., "The ...
Ishizuka K., Nakatani T., Fujimoto M., and Miyazaki N., "Noise ...
Fujimoto M., Ishizuka K., and Nakatani T., "A voice activity ...
Fujimoto M. and Ishizuka K., "Noise robust v oice activity ...
Kristjansson T., Deligne S., and Olsen P., *Voicing features for ...
Li K., Swamy M. N. S. and Ahmad M.O., ،0An ...
ETSI standard document, ETSI ES 202 050 V1.1.3, 2003. ...
Basu S., A linked-HMM model for robust voicing detection and ...

نمایش کامل مراجع