سامانه شناسایی گفتار فارسی انتها به انتها با استفاده از پس پردازش دادگان پروژه موزیلا
سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 369
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
TECCONF05_092
تاریخ نمایه سازی: 11 مهر 1400
چکیده مقاله:
سامانه های شناسایی گفتار انتها به انتها، سیگنال خام گفتار را به عنوان ورودی گرفته و دنباله برچسب متناظر آن سیگنال را تولید می کنند. پیاده سازی یک سامانه شناسایی گفتار برای هر زبان نیازمند دادگان مناسب برای آن زبان است و بدون دادگان این امر میسر نخواهد شد. تولید دادگانی که هم دارای برچسب مناسب باشد و هم فایل صوتی آن از کیفیت مناسبی برخوردار باشد، نیازمند صرف هزینه است. پروژه موزیلا اخیرا با استفاده از مجموعه دادگانی که برای زبان های مختلف تهیه کرده به ساخت این سامانه ها حتی برای زبان هایی که دادگان کمی در دسترس دارند، کمک شایانی نموده است. در این مقاله ابتدا بر روی این دادگان پس پردازش انجام شد و سپس با استفاده از آن، یک مدل صوتی آموزش داده شد. با این پیاده سازی درصد خطای کلمه سامانه بر روی دادگان آزمون فارس دات کوچک به ۴۶.۶۰ و درصد خطای حرف سامانه به ۱۷.۸۴ رسید
کلیدواژه ها:
نویسندگان
سعید زارعی
دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران
یاسر شکفته
دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی تهران، ایران