کلاس بندی مکالمات تلفنی شرکت خدماتی آب و فاضلاب با استفاده از شبکه های یادگیری عمیق

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 316

فایل این مقاله در 7 صفحه با فرمت PDF و WORD قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CONFSKU02_028

تاریخ نمایه سازی: 11 آبان 1401

چکیده مقاله:

به طور حتم یکی از مهم ترین موضوعات مطرح و پیچیده در علوم کامپیوتر، تشخیص گفتار است. مهم ترین و قوی ترین ابزار تشخیص گفتار، استفاده از هوش مصنوعی و الگوریتم های تشخیص گفتار است. هنگامی که یک صدا به کامپیوتر داده می شود، این صدا برای آن قابل فهم نیست بلکه باید از الگوریتم های تشخیص گفتار استفاده شود تا کامپیوتر به یک فهم خوب از صدای دریافتی برسد. در این پژوهش سعی شده تا با استفاده از الگوریتم های کلاس بندی، روشی مناسب برای کلاس بندی صوت های ضبط شده بخش خدمات شرکت آب و فاضلاب به عنوان ورودی توسط هوش مصنوعی کامپیوتر ارائه شود. برای این منظور ما جدیدترین شبکه عصبی به نام Yamnet را تغییر داده ایم تا گفتار فارسی را به عنوان ورودی به صورت خام دریافت کند و عملیات کلاس بندی گفتار را انجام دهد. ابتدا نمونه های آموزشی به صورت گفتار تلفنی زبان فارسی تهیه شده و به صورت خام جهت آموزش داده ها به شبکه عصبی داده شده اند. این مدل بر روی کلاس بندی داده های آزمایشی به دقتی به اندازه ۹۳ درصد رسید. درنهایت، صداهای خام با تبدیل فوریه کوتاه مدت و ضریب کپسترال فرکانس مل پردازش شدند و سپس از این ویژگی ها به عنوان ورودی مدل استفاده شد. مدل با ورودی صوت خام در مقایسه با ورودی پیش پردازش صدا با تبدیل فوریه کوتاه مدت و ضریب کپسترال فرکانس مل عملکرد بهتر و یا معادل نشان داد.

کلیدواژه ها:

پردازش صوتی ، یادگیری عمیق ، یامنت ، تبدیل فوریه کوتاه مدت ، ضریب کپسترال فرکانس مل

نویسندگان

الهه بابایی

گروه کامپیوتر، دانشکده برق و کامپیوتر، دانشگاه صنعتی قم ، قم،

عبدالرضا رسولی کناری

گروه کامپیوتر، دانشکده برق و کامپیوتر، دانشگاه صنعتی قم ، قم،

محبوبه شمسی

گروه کامپیوتر، دانشکده برق و کامپیوتر، دانشگاه صنعتی قم ، قم،

سیدابراهیم هزارخانی

گروه کامپیوتر، دانشکده برق و کامپیوتر، دانشگاه صنعتی قم ، قم،