سامانه شناسایی گفتار فارسی انتها به انتها با استفاده از پس پردازش دادگان پروژه موزیلا

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 369

فایل این مقاله در 6 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TECCONF05_092

تاریخ نمایه سازی: 11 مهر 1400

چکیده مقاله:

سامانه های شناسایی گفتار انتها به انتها، سیگنال خام گفتار را به عنوان ورودی گرفته و دنباله برچسب متناظر آن سیگنال را تولید می کنند. پیاده سازی یک سامانه شناسایی گفتار برای هر زبان نیازمند دادگان مناسب برای آن زبان است و بدون دادگان این امر میسر نخواهد شد. تولید دادگانی که هم دارای برچسب مناسب باشد و هم فایل صوتی آن از کیفیت مناسبی برخوردار باشد، نیازمند صرف هزینه است. پروژه موزیلا اخیرا با استفاده از مجموعه دادگانی که برای زبان های مختلف تهیه کرده به ساخت این سامانه ها حتی برای زبان هایی که دادگان کمی در دسترس دارند، کمک شایانی نموده است. در این مقاله ابتدا بر روی این دادگان پس پردازش انجام شد و سپس با استفاده از آن، یک مدل صوتی آموزش داده شد. با این پیاده سازی درصد خطای کلمه سامانه بر روی دادگان آزمون فارس دات کوچک به ۴۶.۶۰ و درصد خطای حرف سامانه به ۱۷.۸۴ رسید

کلیدواژه ها:

انتها به انتها ، پس پردازش دادگان موزیلا ، شناسایی خودکار گفتار.

نویسندگان

سعید زارعی

دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران

یاسر شکفته

دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران