افزایش داده مبتنی بر شبکه ی عصبی مولد رقابتی چرخشی با هدف بهبود کارایی بازشناسی احساس از گفتار

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 216

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSICC28_011

تاریخ نمایه سازی: 27 اسفند 1401

چکیده مقاله:

بازشناسی احساس از گفتار، یک زمینه ی فعال تحقیقاتی در حوزه پردازش گفتار محسوب می شود. اما علیرغم پیشرفت های گسترده ای که در حوزه ی یادگیری ماشین حاصل شده است، کارایی سیستم های بازشناسی احساس از گفتار چندان مطلوب نمی باشد. یکی از اصلی ترین دلایل آن کمبود دادگان احساسی خصوصا از نوع برچسب دار است. در این مقاله، با الهام از پژوهش های انجام شده در این حوزه به یکی از راه حل های فراگیر چند سال اخیر در رابطه با افزایش دادگان یعنی شبکه های مولد رقابتی پرداخته می شود. معماری در نظر گرفته شده یک شبکه ی مولد رقابتی چرخشی است که با استفاده از یک مجموعه داده ی بدون برچسب سعی می کند به تولید بردارهای ویژگی جدید که بازنمایی از یک احساس مورد نظر در مجموعه داده ی برچسب دار هستند بپردازد و به این شکل منجر به افزایش داده برای مجموعه داده ی برچسب دار می شود. این مدل بر روی دو مجموعه ی دادگان IEMOCAP و ShEMO ارزیابی شده است. نتایج حاصل حاکی از آن است که استفاده از بردارهای ویژگی تولید شده توسط شبکه در کنار بردارهای ویژگی واقعی برای مجموعه ی دادگان IEMOCAP و ShEMO، به ترتیب باعث بهبود بازخوانی به میزان ۱۴ درصد و نه درصد با استفاده از دسته بند ANN و نه درصد و ده درصد با استفاده از دسته بند CNN می شود

کلیدواژه ها:

بازشناسی احساس از گفتار ، شبکه های مولد رقابتی چرخشی ، افزایش داده ، یادگیری عمیق

نویسندگان

فرنوش کریمی

پژوهشکده فضای مجازی، دانشگاه شهید بهشتی، تهران، ایران

شیما طبیبیان

استادیار، پژوهشکده فضای مجازی، دانشگاه شهید بهشتی تهران، تهران، ایران