Emotion Recognition for Persian Speech Using Convolutional Neural Network and Support Vector Machine

سال انتشار: 1402
نوع سند: مقاله ژورنالی
زبان: انگلیسی
مشاهده: 68

فایل این مقاله در 21 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_COAM-8-2_006

تاریخ نمایه سازی: 15 آذر 1402

چکیده مقاله:

The paper discusses the limitations of emotion recognition in Persian speech due to inefficient feature extraction and classification tools‎. ‎To address this‎, ‎we propose a new method for detecting hidden emotions in Persian speech with higher recognition accuracy‎. ‎The method involves four steps‎: ‎preprocessing‎, ‎feature description‎, ‎feature extraction‎, ‎and classification‎. ‎The input signal is normalized in the preprocessing step using single-channel vector conversion and signal resampling‎. ‎Feature descriptions are performed using Mel-Frequency Cepstral Coefficients and Spectro-Temporal Modulation techniques‎, ‎which produce separate feature matrices‎. ‎These matrices are then merged and used for feature extraction through a Convolutional Neural Network‎. ‎Finally‎, ‎a Support Vector Machine with a linear kernel function is used for emotion classification‎. ‎The proposed method is evaluated using the Sharif Emotional Speech dataset and achieves an average accuracy of ۸۰.۹% in classifying emotions in Persian speech‎.

نویسندگان

Saeed Hashemi

‎Department of Computer Engineering and Information Technology‎, ‎Payame Noor University (PNU)‎, ‎Tehran‎, ‎Iran

Saeed Ayat

‎Department of Computer Engineering and Information Technology‎, ‎Payame Noor University (PNU)‎, ‎Tehran‎, ‎Iran

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Alabsi, A., Gong, W., Hawbani, A. (۲۰۲۲). “Emotion recognition based ...
  • Alghifari, M.F., Gunawan, T.S., Kartiwi, M. (۲۰۱۸). “Speech emotion recognition ...
  • Badie, A., Moragheb, M.A., Noshad, A. (۲۰۲۱). “An efficient approach ...
  • Edraki, A., Chan, W.Y. G., Jensen, J., Fogerty, D. (۲۰۱۹). ...
  • Edraki, A., Chan, W.Y., Jensen, J., Fogerty, D. (۲۰۲۲). “Spectro-temporal ...
  • Fahad, M., Deepak, A., Pradhan, G., Yadav, J. (۲۰۲۱). “DNN-HMM-based ...
  • Horkous, H., Guerti, M. (۲۰۲۱). “Recognition of anger and neutral ...
  • Hossin, M., Sulaiman, M.N. (۲۰۱۵). “A review on evaluation metrics ...
  • Ke, X., Zhu, Y., Wen, L., Zhang, W. (۲۰۱۸). “Speech ...
  • Kumbhar, H.S., Bhandari, S.U. (۲۰۱۹). “Speech emotion recognition using MFCC ...
  • Liu, Z.T., Rehman, A., Wu, M., Cao, W.H., Hao, M. ...
  • Nezami, M.O., Jamshid Lou, P., Karami, M. (۲۰۱۹). “ShEMO: A ...
  • Panagakis, Y., Kotropoulos, C., Arce, G.R. (۲۰۰۹). “Non-negative multilinear principal ...
  • Pisner, D.A., Schnyer, D.M. (۲۰۲۰). “Support vector machine”, In Machine ...
  • Ravanbakhsh, M., Setayeshi, S., Pedram, M.M., Mirzaei, A. (۲۰۲۰). “Evaluation ...
  • Siadat, S.R., Voronkov, I.M., Kharlamov, A.A. (۲۰۲۲). “Emotion recognition from ...
  • Tiwari, P., Darji, A.D. (۲۰۲۲). “A novel S-LDA features for ...
  • Yadav, S.P., Zaidi, S., Mishra, A., Yadav, V. (۲۰۲۲). “Survey ...
  • نمایش کامل مراجع