تشخیص احساس از سیگنال گفتار به کمک روشهای افزایش داده متخاصمی

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 439

فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ISCEE20_045

تاریخ نمایه سازی: 6 مهر 1400

چکیده مقاله:

امروزه با ماشینی شدن زندگی روزمره، پردازش گفتار برای تعامل بین انسان و ماشین از اهمیت بالایی برخوردار شده است.تشخیص احساسات از گفتار، برای درک دقیق معانی جملات و همچنین ایجاد واکنش مناسب به گوینده، از سوی ماشینضروری است. احساس به عوامل متعددی از جمله جنسیت، تن صدا، زبان و برخی ویژگی های فردی وابسته است که کارتشخیص آن را سخت می کند. هرچه ویژگی های استخراج شده از گفتار بیشتر باشد، نیاز به داده های بیشتری برای آموزششبکه عصبی می باشد و تنها در صورت وجود داده به تعداد کافی، منجر به دقت بهتر در طبقه بندی می شود. یکی از عمده ترینمشکلات موجود در تشخیص احساس از گفتار، کمبود داده در هر کلاس جهت آموزش شبکه عصبی است. در صورت عدموجود تعداد زیاد داده می توان از روش های افزایش داده استفاده کرد.این مقاله با هدف ایجاد یک شبکه مولد متخاصمی جهت افزایش داده ها در یک سیستم تشخیص احساس از گفتار متمرکزشده است . برای هر احساس به صورت جداگانه یک شبکه مولد متخاصمی پیشنهاد می شود که از یک سو شباهت بیننمونه های واقعی و تولید شده را تضمین کند و از طرف دیگر باعث ایجاد تمایز عاطفی در بین نمونه های تولید شده بینکلاس های مختلف شود. کیفیت داده های مصنوعی در هر دو آزمایش درون کلاسی و بین کلاسی مورد ارزیابی قرار می گیردو علاوه بر این، تلاش می شود با استخراج و تکثیر ویژگی های سطح بالا از ویژگی های صوتی گفتار، تشخیص احساس ازگفتار با پنج کلاس احساسی با دقت بالاتری صورت پذیرد.

کلیدواژه ها:

تشخیص احساس از گفتار ، افزایش داده ، یادگیری عمیق ، شبکه های مولد متخاصمی

نویسندگان

آرش شیلاندری

دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی شاهرود، شاهرود، ایران

حسین مروی

دانشیار دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی شاهرود، شاهرود، ایران

حسین خسروی

دانشیار دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی شاهرود، شاهرود، ایران