سنتز گفتار فارسی با استفاده از فرکانس گام در نرم افزار Flite

سال انتشار: 1398
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 197

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JASP-3-1_010

تاریخ نمایه سازی: 18 مهر 1400

چکیده مقاله:

در این پژوهش، طراحی و پیاده سازی سنتز کننده گفتار به زبان فارسی با استفاده از نرم افزار Flite ارائه شده است. بدین طریق که ابتدا توسط پایگاه داده جملات فارسی فارس دات، میانگین و انحراف معیار فرکانس گام و بزرگترین فرکانس گام هر واج واک دار را به دست می آوریم. سپس تغییرات هر واج عبارت موردنظر را از طریق محاسبه مقدار ارزش آن با توجه به فرمول ارائه شده پیشنهادی، در نرم افزار وارد می کنیم. ویژگی این سنتز کننده، تبدیل متن به گفتار با لهجه و تلفظ فارسی می باشد. در انتهای این مقاله، نتایج حاصل از اجرای الگوریتم پیشنهادی با منحنی فرکانس های گام به دست آمده توسط پایگاه داده جملات فارسی فارس دات، مقایسه شده است. همچنین، در این پژوهش چند نمونه از جملات زبان فارسی مربوط به پایگاه داده جملات فارسی فارس دات، با استفاده از روش پیشنهادی بر روی نرم افزار Flite، مورد سنتز قرارگرفته است. آزمون های شنیداری، برای میزان قابل فهم بودن، طبیعی بودن و خوشایند بودن جملات مذکور انجام شده است که نتایج آن ها برای جملات آموزش به ترتیب ۴.۴، ۴.۲ و ۴.۶ می باشد. همچنین برای جملات مجموعه آزمون، به ترتیب برابر ۴.۲، ۴.۱ و ۴.۳ می باشد.

کلیدواژه ها:

نویسندگان

فاطمه نعیمی

گروه مهندسی برق، واحد سمنان، دانشگاه آزاد اسلامی، سمنان، ایران

وحید قدس

باشگاه پژوهشگران جوان و نخبگان، واحد سمنان، دانشگاه آزاد اسلامی، سمنان، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • A. B. Black and K. A. Lenzo, Building synthetic voices, ...
  • تبدیل حرف به صدا در سیستم های تبدیل متن به گفتار فارسی با استفاده از درختهای تصمیم گیری CART [مقاله کنفرانسی]
  • R. Kurzweil, The singularity is near, Penguin Books, ISBN ۹-۳۰۳۷۸۸-۱۴-۰, ...
  • A.B. Black and K.A. Lenzo, Flite: a small, fast speech ...
  • A. B. Black, P. Taylor and R. Caley, The Festival ...
  • محمدمهدی همایون پور، مجید نم نبات، «تبدیل حرف به صدا ...
  • محمدمهدی همایون پور، سیدمصطفی موسوی، «تولید پارامترهای سنتز گفتار فارسی ...
  • Y. Sagisaka, “Speech synthesis from text,” IEEE Commun. Mag., pp. ...
  • منصور شیخان نصیرزاده. مجید و دفتریان. علی، «طراحی و پیاده ...
  • محمدمهدی همایون پور، آرمین سلیمی بدر، «تعیین مرز و نوع ...
  • N. Thorensen, “Sentence intonation in textual context-supplementary data,” J. Acoust. ...
  • Y. Sagisaka, “On the prediction of global F۰ shape for ...
  • J. Buhmann, et al. “Intonation modeling for the synthesis of ...
  • M. Riedi, “A neural-network-based model of segmental duration for speech ...
  • Z. Yiqing, “Syllable duration and its functions in standard Chinese ...
  • C.L. Smith, “Modeling durational variability in reading aloud a connected ...
  • Y. Sagisaka, and Sato H. “Accentuation rules in Japanese TTS ...
  • P. H. Low and S. Vaseghi, “Application of microprosody models ...
  • Y. Hifny. and M. Rashwan, “Duration modeling for Arabic TTS ...
  • A. Breen, “Speech synthesis models: a review,” Elect. Commun. Engng. ...
  • سیدسعید آیت، طراحی و پیاده سازی سیستم تولید گفتار فارسی ...
  • S. Lemmetty, Review of Speech Synthesis Technology, Master Thesis, Helsinki ...
  • نمایش کامل مراجع