CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

سازوکاری برای بهینه سازی استخراج ویژگی برای تشخیص هممرجعی ضمیر و اسم اشاره در زبان فارسی

عنوان مقاله: سازوکاری برای بهینه سازی استخراج ویژگی برای تشخیص هممرجعی ضمیر و اسم اشاره در زبان فارسی
شناسه ملی مقاله: KBEI05_039
منتشر شده در پنجمین کنفرانس مهندسی دانش بنیان و نوآوری در سال 1397
مشخصات نویسندگان مقاله:

لادن مداح - دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت استان تهران تهران، ایران
بهروز مینایی - دانشکده مهندسی کامپیوتر،دانشگاه علم و صنعت استان تهران تهران، ایران

خلاصه مقاله:
تشخیص هم مرجعی یکی از پایه های مهم در پردازش زبانطبیعی می باشد. کاربردهای مهمی در حوزه هایی مانند پاسخ گویی به سوال،ترجمه ماشین، خلاصه سازی اتوماتیک و استخراج موجودیت نامدار دارد.وظیفه ی تشخیص هم مرجعی حل و فصل عبارت های اسمی و ضمایر در متناست که به موجودیت یکسان ارجاع می دهد. روش های تشخیص هم مرجعیرا می توان به دو دسته ی روش های زبان شناسی و روش های یادگیری ماشینتقسیم نمود. روش های زبان شناسی بیشتر به اطلاعات زبانشناسی نیاز دارند،البته مشکلی که این روشها دارند این است که احتمال خطا در آنها بیشتراست همچنین اجرای این روشها زمان بر می باشند، درحالی که روش هاییادگیری ماشین کمتر به اطلاعات زبانشناسی نیاز دارند. در این مقالهسیستمی ارائه می شود که اسم های هم مرجعی موجود در متن را شناساییکرده و با درنظرگرفتن ویژگی های مشخص شده نمونه های مثبت و منفی رااز پیکره استخراج می کند. از جمله نوآوری هایی که انجام شد اضافه کردنویژگی هایی به سیستم می باشد که از آن ها برای عمل تشخیص مرجعضمیر استفاده می شود. این ویژگی ها از نقش نحوی عبارت اسمی کاندید وضمیر استفاده کرده است. با تغییر دادن این ویژگی ها در سیستم دربهترین حالت میتوان به دقت 59.4 درصد دست پیدا کردیم.

کلمات کلیدی:
پردازش زبان طبیعی، پیکره زبان فارسی، تشخیص مرجع ضمیر، یادگیری ماشین

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/988924/