طراحی و پیاده سازی الگوریتم یادگیری عمیق جهت شناسایی دستورات گفتاری در سیگنالهای صوتی

علی, درجانی مروی; مجتبی, بهنام تقدسی

طراحی و پیاده سازی الگوریتم یادگیری عمیق جهت شناسایی دستورات گفتاری در سیگنالهای صوتی

عنوان مقاله: طراحی و پیاده سازی الگوریتم یادگیری عمیق جهت شناسایی دستورات گفتاری در سیگنالهای صوتی
شناسه ملی مقاله: CMECE03_045
منتشر شده در سومین کنفرانس بین المللی مکانیک،مهندسی برق و کامپیوتر در سال 1399

مشخصات نویسندگان مقاله:

علی درجانی مروی - کارشناسی ارشد برق گرایش مکاترونیک، دانشگاه بین المللی امام رضا
مجتبی بهنام تقدسی - دکتری برق مکاترونیک، دانشگاه پلی تکنیک ایتالیا

خلاصه مقاله:

تکنولوژی پردازش سیگنالهای گفتاری، شیوهای جدید برای تشخیص پیامها و دستورهای صوتی و حاصل پژوهش جمعی از محققان در زمینه سیگنالهای صحبت است. جدا کردن دستورات گفتاری از سیگنال صحبت به هوشمندی نیازمند بوده و بسیار از تولید آن مشکل تر میباشد. از آنجایی که سیگنالهای صحبت به صورت عمومی آن بسیار پیچیده است، ساده سازی آن مفید به نظر میرسد. یادگیری عمیق شاخه ای از بحث یادگیری ماشینی و مجموعه ای از الگوریتم هایی است که تلاش میکند مفاهیم انتزاعی سطح بالا را با استفاده یادگیری در سطوح و لایه های مختلف مدل کنند. هدفش درک ماشینی است که دارای توانایی های شناختی مشابه به ذهینیت انسان است. هدف اصلی تحقیق حاضر طراحی و پیاده سازی الگوریتم یادگیری عمیق جهت شناسایی دستورات گفتاری در سیگنالهای صوتی است. جهت رسیدن به هدف مذکور این پژوهش با طراحی و پیاده سازی الگوریتم یادگیری عمیق جهت شناسایی دستورات گفتاری در سیگنالهای صوتی به کمک پایگاه داده ۳۰ speech_commands_v۰.۰۱.tar کلمه با محتوای صوتی با مضمون دستور گفتاری و غیر دستور گفتاری انجام شد. مدل شبکه عصبی پیچشی در ۵۵۰ تکرار در ۱۰ دوره به صورت آموزش یافته با دقت ۹۳,۲۴ درصد تشکیل شد. با برآورد مدل ماتریس در هم تنیدگی دقت و صحت هر کلمه محاسبه شد که نتایج نشان می دهد که مدل از دقت بالایی برخوردار است.

کلمات کلیدی:

پردازش سیگنال، سیگنال صحبت، دستورات گفتاری، یادگیری عمیق.

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1162248/