CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مقاوم سازی ویژگی های گفتار بوسیله شبکه باور تطبیق پذیر با نویز

عنوان مقاله: مقاوم سازی ویژگی های گفتار بوسیله شبکه باور تطبیق پذیر با نویز
شناسه ملی مقاله: SPIS02_015
منتشر شده در دومین کنفرانس بین المللی پردازش سیگنال و سیستم های هوشمند در سال 1395
مشخصات نویسندگان مقاله:

محمدرضا عبدالهی - دانشجوی ارشد، دانشکده مهندسی کامپوتر، دانشگاه صنعتی خواجه نصیر الدین طوسی، تهران
بابک ناصر شریف - دانشکده مهندسی کامپیوتر، دانشگاه صنعتی خواجه نصیر الدین طوسی، تهران

خلاصه مقاله:
امروزه شبکه های عصبی عمیق کاربردهای زیادی در بازشناسی گفتار پیدا کرده اند. این شبکه ها در مدل سازی آکوستیک، استخراج ویژگی و حذف نویز مورد استفاده قرار می گیرند. از انجا که معمولا داده های زیادی برای آموزش یک شبکه عصبی عمیق با عمق زیاد لازم است، در بحث مدلسازی اکوستیک، روش - هایی برای تطبیق این شبکه ها با گوینده جدید مطرح گردیده اند. در مقاله حاضر، از ایده تطبیق شبکه های عصبی عمیق برای تطبیق با یک نویز جدید بهره گرفته شده است. به این منظور، در ابتدا، یک شبکه باور عمیق برای نگاشت ویژگی های نویزی لگاریتم انرژی زیر باندهای مل به نوع تمیز آن، با استفاده از دادگان نویزی آموزش داده شده است. سپس برای تطبیق با محیط های نویزی جدید، یک لایه با نقش تبدیل خطی به شبکه باور عمیق نگاشت گر افزوده شده است. نتایج ارزیابی بر روی دادگان Aurora2 نشان می دهد که با معماری های مختلف شبکه باور عمیق، افزودن لایه تطبیق در هر یک از حالات ورودی و خروجی باعث بهبود عملکرد شبکه باور عمیق نگاشت گر ویژگی شده است به نحوی که دقت بازشناسی گفتار ر1 تا 7 درصد در اثر نگاشت ویژگی ها افزایش داده است.

کلمات کلیدی:
تطبیق با نویز شبکه باورعمیق بازشناسی گفتار مقاوم سازی تبدیل خطی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/611710/