CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ترجمه ماشینی آماری با استفاده از برچسب های کم عمق نحوی

عنوان مقاله: ترجمه ماشینی آماری با استفاده از برچسب های کم عمق نحوی
شناسه ملی مقاله: ICIKT08_052
منتشر شده در هشتمین کنفرانس بین المللی فناوری اطلاعات ودانش در سال 1395
مشخصات نویسندگان مقاله:

شهرام سلامی - دانشگاه شهید بهشتی، دانشکده مهندسی و علوم کامپیوتر
مهرنوش شمس فرد - دانشگاه شهید بهشتی، دانشکده مهندسی و علوم کامپیوتر

خلاصه مقاله:
این مقاله مدل سلسله مراتبی جدیدی را برای ترجمه ماشینی آماری پیشنهاد می دهد که غیرپایانه ها را با تطابق مرز عبارات مقصد با برچسب هایکم عمق نحوی در سمت مقصد پیکره آموزش، نامگذاری می کند. در جایی که برچسبی برای کل عبارت موجود نباشد، نام غیرپایانه از اتصالبرچسب های مرزی تعریف می شود. برچسب گذاری با کلاس کلمات مرزی عبارات قبلا معرفی گردیده است که می تواند شکل مبنای مدلپیشنهادی درنظر گرفته شود. ما این شکل مبنا را در مقاله حاضر با استفاده از برچسب قطعات توسعه می دهیم. در این توسعه، اگر برچسب قطعهدر مرز عبارت وجود نداشته باشد، از برجسب POS کلمه مرزی استفاده می شود. با استفاده از برچسب عبارات به جای کلاس کلمات، قواعد مدلپیشنهادی تعمیم داده می شود. تعدادی آزمایش در ترجمه فارسی به انگلیسی انجام شد. با استفاده از معیار BLEU در قیاس با مدل SAMTکه از درخت تجزیه نحوی برای برچسب گذاری استفاده می کند، مدل پیشنهادی بهبود قابل توجهی به دست آورد.

کلمات کلیدی:
ترجمه ماشینی آماری، مدل سلسله مراتبی، برچسب کلمه، برچسب قطعه

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/548711/