CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

استفاده از برچسب های پیشرفته در تجزیهگرهای مبتنی بر گرامر درخت-افزایشی

عنوان مقاله: استفاده از برچسب های پیشرفته در تجزیهگرهای مبتنی بر گرامر درخت-افزایشی
شناسه ملی مقاله: ACCSI12_315
منتشر شده در دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1385
مشخصات نویسندگان مقاله:

هشام فیلی - عضو هیئت مدیره شرکت داده پردازان دوران
محسن عرب سرخی - مسئول تحقیق و توسعه، گروه پردازش زبان طبیعی، شرکت داده پردازان دوران

خلاصه مقاله:
قدرت بالای مدلسازی جملات زبان طبیعی توسط گرامر های درخت-افزایشی سبب شد که از آنها در کاربرد های ترجمه ماشینی و پردازش معنایی استفاده شو د. ولی است فاده از این مدل با دو مشکل اصلی روبرو است، سرعت پائین تجزیه نحوی و وجود ابهامات متعدد در نتایج تجزیه گ ر. بطوریکه استفاده از این گرامر را در کاربرد های واقعی با مشکل جدی مواجه کرده است. بدین دلیل از یک روش تجزیهگر جزئی مبتنی بر این مدل با نام برچس بگذار پ یشرفته استفاده شده است . برخلاف مدل گرامری سابق، خروجی الگوریت مهای تجزیهگر مبتنی بر برچس بها ی پیشرفته بصورت درخ تهای نحوی جزئی است که در کل ساختار جمله تجزیه نمیگردد و بخشهایی از ساختار خروجی آن با خطاهایی مواجه است. در این مقاله، سعی شده است که در د و فاز تشخیص و تصحیح خطا، ساختار های خطادار در مرحله اول تشخیص و سپس با ساختار نحوی درست آن جایگزین گرد د. عملا هم از سرعت مناسب برچسب گذار پیشرفته استفاده شده است و هم خروجی تجزیه کامل گرامر درخت -افزایشی ایجاد می گردد . نتایج بر روی پایگاه درختی Pennحاکی از دقت نزدیک به ۸۰ % بدون ابهام و با سرعت تجزیه قبول است.

کلمات کلیدی:
گرامر درخت-افزایشی، برچسب پیشرفته، ترجمه ماشینی، زبان فارسی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/44701/