یک مدل بازنمایی برداری واژگان برای ترجمه ی ماشینی انگلیسی به فارسی با استفاده از یادگیری ژرف

لیلا افسر; سیدعلی کتان فروش; محمدرضا اصغری اسکویی

یک مدل بازنمایی برداری واژگان برای ترجمه ی ماشینی انگلیسی به فارسی با استفاده از یادگیری ژرف

محل انتشار: کنفرانس بین المللی مهندسی و علوم کامپیوتر

سال انتشار: 1395

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 858

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/648423

شناسه ملی سند علمی:

ICCSE01_271

تاریخ نمایه سازی: 14 شهریور 1396

چکیده مقاله:

یادگیری عمیق رویکرد جدیدی در زمینه ی یادگیری ماشین است. یادگیری عمیق دیدگاه نوینی برای ترجمهی ماشینی فراهم کرده است.این دیدگاه به ترجمه ی ماشینی عصبی معروف است. آموزش یکپارچه ی این سیستم ها برای ترجمه ی ماشینی انگلیسی به فارسی، نیازبه پیکره ی متنی موازی بزرگ دارد. متاسفانه در زبان فارسی چنین پیکاره ی متنی بزرگی در دستری نیست. باعنوان یک راه حالجایگزین، داده ی متنی بزرگ فارسی، برای بازنمایی برداری واژگان جمع آوری شد. برای بازنمایی برداری واژگان از روشWord2Vec استفاده شد. دو پارامتر بعد فضای برداری و حجم مجموعه دادگان در بازنمایی برداری واژگان در روش Word2Vecتاثیر داشتند. مجموعه تستی برای ارزیابی بازنمایی برداری واژگان با استفاده از معیار شباهت کسینوسی ارایه شد. بردارهایبه دست آمده از روش Word2Vec روی مجموعه تست تعریف شده برای زبان فارسی، ازلحاظ شباهت معنایی و نحوی واژگان عملکردقابل توجهی به نمایش گذاشت.

کلیدواژه ها:

بازنمایی برداری واژگان ، Word2Vec ، ترجمه ی ماشینی عصبی ، یادگیری عمیق ، پردازش زبان طبیعی

نویسندگان

لیلا افسر

دانشجو، علوم ریاضی و رایانه، دانشگاه علامه طباطبایی، تهران

سیدعلی کتان فروش

استادیار، گروه علوم کامپیوتر، دانشگاه شهید بهشتی، تهران

محمدرضا اصغری اسکویی

استادیار، علوم ریاضی و رایانه، دانشگاه علامه طباطبایی، تهران