افزایش داده مبتنی بر شبکه ی عصبی مولد رقابتی چرخشی با هدف بهبود کارایی بازشناسی احساس از گفتار
سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 216
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSICC28_011
تاریخ نمایه سازی: 27 اسفند 1401
چکیده مقاله:
بازشناسی احساس از گفتار، یک زمینه ی فعال تحقیقاتی در حوزه پردازش گفتار محسوب می شود. اما علیرغم پیشرفت های گسترده ای که در حوزه ی یادگیری ماشین حاصل شده است، کارایی سیستم های بازشناسی احساس از گفتار چندان مطلوب نمی باشد. یکی از اصلی ترین دلایل آن کمبود دادگان احساسی خصوصا از نوع برچسب دار است. در این مقاله، با الهام از پژوهش های انجام شده در این حوزه به یکی از راه حل های فراگیر چند سال اخیر در رابطه با افزایش دادگان یعنی شبکه های مولد رقابتی پرداخته می شود. معماری در نظر گرفته شده یک شبکه ی مولد رقابتی چرخشی است که با استفاده از یک مجموعه داده ی بدون برچسب سعی می کند به تولید بردارهای ویژگی جدید که بازنمایی از یک احساس مورد نظر در مجموعه داده ی برچسب دار هستند بپردازد و به این شکل منجر به افزایش داده برای مجموعه داده ی برچسب دار می شود. این مدل بر روی دو مجموعه ی دادگان IEMOCAP و ShEMO ارزیابی شده است. نتایج حاصل حاکی از آن است که استفاده از بردارهای ویژگی تولید شده توسط شبکه در کنار بردارهای ویژگی واقعی برای مجموعه ی دادگان IEMOCAP و ShEMO، به ترتیب باعث بهبود بازخوانی به میزان ۱۴ درصد و نه درصد با استفاده از دسته بند ANN و نه درصد و ده درصد با استفاده از دسته بند CNN می شود
کلیدواژه ها:
نویسندگان
فرنوش کریمی
پژوهشکده فضای مجازی، دانشگاه شهید بهشتی، تهران، ایران
شیما طبیبیان
استادیار، پژوهشکده فضای مجازی، دانشگاه شهید بهشتی تهران، تهران، ایران