CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ابهام زدایی معانی کلمات با استفاده از روشهای آماری

عنوان مقاله: ابهام زدایی معانی کلمات با استفاده از روشهای آماری
شناسه ملی مقاله: CSICC15_157
منتشر شده در پانزدهمین کنفرانس کامپیوتر سالانه انجمن کامپیوتر ایران در سال 1388
مشخصات نویسندگان مقاله:

محمود سلطانی - دانشکده برق و کامپیوتر دانشگاه تهران
هشام فیلی - دانشکده برق و کامپیوتر، دانشگاه تهران

خلاصه مقاله:
در این مقاله یک روش آماری برای ابهامزدایی معنایی کلمات به منظور استفاده در یک مترجم ماشینی انگلیسی به فارسی ارائه شده است. درهنگام خواندن یک متن انگلیسی به دفعات با کلماتی روبرو میشویم که برای آنها در زبان فارسی بیش از یک معنی معادل وجود دارد. این نوع چند معنایی و یا به عبارت دیگر ابهام برای سیستمهای مترجم ماشینی چالشی بزرگ بهشمار میآید. در این مقاله روشی برای ابهامزدایی معنایی کلمات به منظور استفاده در یک مترجم ماشینی انگلیسی به فارسی ارانه شده است. در این روش ابتدا معانی مختلف کلمات مبهم از یک فرهنگلغت دوزبانه (انگلیسی به فارسی) استخراج شده و سپس براساس اطلاعات آماری استخراج شده از یک پیکره متنی تکزبانه (فارسی) گراف وابستگی معنایی کلمات ساخته شده است. این گراف شامل معانی مختلف کلمات مبهم جمله و وابستگی معنایی بین آنها است. همچنین روش جدیدی به منظور تقویت معیار وابستگی معنایی کلمات ارائه شده است. یکی از ویژگیهای این روش عدم وابستگی آن به زبانهای مبدا و مقصد میباشد و میتواند برای هر جفت زبان در ترجمه ماشینی مورد استفاده قرار گیرد.

کلمات کلیدی:
ابهامزدایی معنایی واژگان ، ترجمه ماشینی، وابستگی معنایی کلمات وپیکره متنی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/79090/