CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

روش برچسبگذاری واج گونهای پیکرههای گفتاری بر اساس الفبای آوانگاری بین المللی

عنوان مقاله: روش برچسبگذاری واج گونهای پیکرههای گفتاری بر اساس الفبای آوانگاری بین المللی
شناسه ملی مقاله: JR_JLRZ-13-38_007
منتشر شده در در سال 1400
مشخصات نویسندگان مقاله:

طاهره احمدی - دانشجوی دکتری تخصصی، گروه زبانشناسی، دانشکده زبانهای خارجی، دانشگاه اصفهان
بتول علی نژاد - دکتری تخصصی زبانشناسی، دانشیار گروه زبانشناسی، دانشکده زبانهای خارجی، دانشگاه اصفهان
حسین کارشناس - دکتری تخصصی هوش مصنوعی، استادیار گروه هوش مصنوعی، دانشکده کامپیوتر، دانشگاه اصفهان
باقر باباعلی - دکتری تخصصی هوش مصنوعی، استادیار دانشکده ریاضی، آمار و علوم کامپیوتر، دانشگاه تهران

خلاصه مقاله:
با توجه به نقش اساسی پیکرهها در بهبود کیفیت عملکرد سیستمهای مبتنی بر داده، بهکارگیری پیکرههای گفتاری مناسب در سیستمهای پردازش گفتار نیز امری ناگزیر است. به طور معمول، در سیستمهای پردازش گفتار، از پیکرههای واجی بهره گرفته میشود. یکی از روشهای شناختهشده برای افزایش دقت سیستمهای پردازش گفتار در سالهای کنونی، بهرهگیری از پیکرههای واجگونهای است. ویژگی آشکار پیکرههای واجگونهای در مقایسه با پیکره ­های واجی، اختصاص برچسبهای واجگونهای به هر یک از واجها است. راه کار پیشنهادی برای تهیه پیکره واجگونهای، پیادهسازی برنامهای با بهرهگیری از روش مبتنی بر قاعده، برای تبدیل واجها به واجگونهها و اعمال این برنامه بر پیکره واجی است. شالوده بهرهگیری از رویکرد مورد اشاره، دسترسی به چنین قواعدی است. پس از تدوین این قواعد از منابع موجود در زبان، ایجاد بستر مناسب پیادهسازی و سپس پیادهسازی برنامه مربوطه و اعمال آن بر پیکره گفتاری واجی، پیکره واجگونهای تهیه میشود. زبان فارسی نیز فاقد پیکره واجگونهای است و پیکره گفتاری فارسدات کوچک در این زبان، دارای تقطیع در سطح واج و واژه است. به منظور تبیین هر چه بهتر راه کار پیشنهادشده در پژوهش حاضر، به عنوان یک نمونه عملی، مرحلههای برچسبگذاری واجگونهای پیکره واجی فارسدات کوچک، به صورت گام به گام اجرا شدهاست.

کلمات کلیدی:
واج, واجگونه, پیکره, نظام الفبای آوانگاری بینالمللی (آی.پی.ای)

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1188333/