CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بررسی تاثیر نوع ویژگی های گفتاری، مشتقات زمانی و برچسب های واجی در استخراج ویژگی های عمیق گلوگاهی

عنوان مقاله: بررسی تاثیر نوع ویژگی های گفتاری، مشتقات زمانی و برچسب های واجی در استخراج ویژگی های عمیق گلوگاهی
شناسه ملی مقاله: ACCSI22_012
منتشر شده در بیست و دومین کنفرانس ملی سالانه انجمن کامپیوترایران در سال 1395
مشخصات نویسندگان مقاله:

امیرحسین حاج احمدی - آزمایشگاه پردازش هوشمند داده های چندرسانه ای، دانشکده مهندسی کامپبوتر، دانشگاه صنعتی امیرکبیر، تهران
محمدمهدی همایون پور - دانشیار، آزمایشگاه پردازش هوشمند داده های چندرسانه ای، دانشکده مهندسی کامپبوتر، دانشگاه صنعتی امیرکبیر، تهران

خلاصه مقاله:
با توجه به اهمیت استفاده از شبکه های عصبی عمیق در بازشناسی خودکار گفتار، در این مقاله با انجام چندین آزمایش مختلف روی مجموعه دادگان گفتاری TIMIT سعی شده است، نحوه استخراج ویژگی های عمیق گلوگاهی، برای انجام بازشناسی خودکار گفتار مورد بررسی قرار گیرد. همچنین جهت بررسی نوع ویژگی های گفتاری ورودی، آموزش بانظارت و تاثیر مشتقات زمانی ویژگی های ورودی آزمایش هایی انجام شده است. از آزمایش های انجام شده مشخص گردید ویژگی های گلوگاهی قادر هستند، در مقایسه با ویژگی های رایج گفتاری مانند MFCC حدود 7 درصد دقت بازشناسی را افزایش دهند. همچنین بهترین دقت بازشناسی از ویژگی های گلوگاهی مربوط به شبکه آموزش دیده بصورت با نظارت، با استفاده از ویژگی ها طیفی مبتنی بر معیار مل (MFSC)، با در نظر گرفتن ویژگی های مشتق زمانی، حاصل شده است.

کلمات کلیدی:
بازشناسی خودکار گفتار، شبکه عصبی عمیق، ویژگی های عمیق گلوگاهی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/635555/