تصدیق هویت گوینده با نرخ بیت بسیار پایین مبتنی بر چندی سازی برداری چند مرحله ای و مقاوم نسبتبه نویزهای نادیده

سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,237

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI13_107

تاریخ نمایه سازی: 25 آبان 1386

چکیده مقاله:

استفاده از روشهای کد نمودن اطلاعات گفتاری برای ارسال و استفاده از کاربردهای مختلف به خصوص در عرصه اینترنت، یکی از زمینه های مهم تحقیقات پژوهشگران در زمینه گفتار می باشد. در میان روشهای مختلف تفکیک فعالیتهای شناسایی میان سرویس دهنده و سرویس گیرنده، روش توامان سرویس دهنده – سرویس گیرنده نتایج بهتری را هم در میزان کاهش بار محاسباتی و هم در کاهش نیاز به پهنای باند زیاد به دست می دهد. همچنین استفاده از روش چندی سازی برداری چند مرحله ای یا MSVQ به علت کاهش نرخ بین ارسالی و دقت قابل قبول در کوانتیزه نمودن داده ها یک روش مناسب برای این امر می باشد. با تلفیق توپولوژی سرویس دهنده – سرویس گیرنده و روش MSVQ در بحث بازشناسی گوینده، راندمان های قابل قبولی بدست آمده است. کاهش نرخ بیت ارسالی از حدود 400 بیت بر فریم بر حدود 40 بیت بر فریم نیز از دیگر موارد جالب توجه در اینروش می باشد. همچنین با در نظر گرفتن چند مدل بر اساس نویزها و SNR های مختلف رای هر گوینده، فرایند مقاوم سازی سیستم نسبت به نویزهای مختلف با شدت های گوناگون انجام گرفته است که نتایج حاصل نشان دهنده کارایی خوب این روش حتی در مواردی است که نوع نویز داده های آموزش و داده های تست متفاوت هستند.

کلیدواژه ها:

نویسندگان

محمدمهدی همایون پور

عضو هیئت علمی ، دانشگاه صنعتی امیرکبیر، دانشکده مهندسی کامپیوتر و فن

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • مجید رئیسی دهکردی، محمد مهدی همایونپور، جهانشاه کبودیان، بهبود روشهای ...
  • C. G. M. Fant, "Acoustic Description and Classification of Phonetic ...
  • Digalakis, Vassilis Neumeyer, Leonardo Perakakis, Manolis, "Product-code Vector quantization of ...
  • V. Digalakis, L. Neumeyer, and M. Perakakis, *Quantization of Cepstral ...
  • Ganesh N. Ramaswamy, Ponani S. Gopalakri shnan, "Compression of acoustic ...
  • Wai c. chu , "speech coding algorithms, foundation and evolution ...
  • W. P. LeBlanc, B. Battacharya, S. A. Mahmoud, and V. ...
  • S. Grassi, M. Ansorge, F. Pellandini, and P.-A. Farine, "Distributed ...
  • C. Broun, W. Campbell, D. Pearce, H. Kelleher, "Speaker recognition ...
  • Client-Server I Client Side l2 Server Side ...
  • نمایش کامل مراجع