CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ترازبندی پیکره تطبیقی دو زبانی انگلیسی فارسی حوزه فاوا در سطح جمله و کلمه

عنوان مقاله: ترازبندی پیکره تطبیقی دو زبانی انگلیسی فارسی حوزه فاوا در سطح جمله و کلمه
شناسه ملی مقاله: ICS11_069
منتشر شده در یازدهمین کنفرانس سراسری سیستم های هوشمند در سال 1391
مشخصات نویسندگان مقاله:

شکوفه دشتبانی - دانشگاه بوعلی سینا
محرم منصوری زاده - عضوهیئت علمی، دانشگاه بوعلی سینا

خلاصه مقاله:
در زبانشناسی رایانه ای مهمترین مرحله ساخت پیکرههای چند زبانی ترازبندی داده های پیکره است. در این مقاله روشی برای ترازبندی جمله های پیکره فارسی تخصصی حوزه فاوا (ICT) و جملات انگلیسی پیکره تخصصی حوزه فاوا ارائه شده است. هدف ما در این پروژه طراحی یک سیستم ترازبندی برای استخراج جمله های متناظر دو زبان است. در این روش ما با استفاده از یک لغتنامه دو زبانی که خودمان ایجاد کرده ایم و تکنیک lcs ، امتیازی را که نشان دهنده شباهت دو جمله است، محاسبه می کنیم. این امتیاز میزان شباهت دو جمله را نشان می دهد. در نهایت اطلاعات مربوط به نگاشت جمله های دو مجموعه ی انگلیسی و فارسی در پایگاه داده پیکره ذخیره می گردد. آزمایشات نشان می دهد که این تکنیک علاوه بر اینکه از نظر دقت بسیار قوی است، تعداد جمله های کاندید را نیز کاهش می دهد

کلمات کلیدی:
ترازبندی جمله (Sentence alignment) ، پیکره تطبیقی، بلندترین زیر دنباله مشترک ( LCS)

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/214652/