CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مروری بر روش های خلاصه سازی خودکار متون

عنوان مقاله: مروری بر روش های خلاصه سازی خودکار متون
شناسه ملی مقاله: ITCC01_363
منتشر شده در کنفرانس بین المللی پژوهش های کاربردی در فناوری اطلاعات، کامپیوتر ومخابرات در سال 1394
مشخصات نویسندگان مقاله:

لیلا طالب علی - گروه مهندسی کامپیوتر، دانشگاه الزهرا (س) ، تهران
نوشین ریاحی - گروه مهندسی کامپیوتر، دانشگاه الزهرا (س) ، تهران

خلاصه مقاله:
امروزه پردازش زبان طبیعی در زمینه های گوناگون نظیر خلاصه سازهای خودکار و مترجم هایماشینی، توجه زیادی را به خود جلب نموده اند. در زبان فارسی هم مانند سایر زبان های دیگر دنیاتلاش هایی در زمینه ساخت ابزارهای خلاصه سازی صورت گرفته است. تمرکز محققان بر ارایهروش هایی متمرکز است که بتواند خلاصه هایی پر محتوا، سلیس و روان نسبت به روشهای خلاصهسازی پیشین ارایه دهند . خلاصه سازی یک مهارت نگارشی به شمار می رود، که هدف از ایجادسیستم خلاصه ساز اتوماتیک تقلید کلیه مراحلی است که توسط عامل انسانی انجام می شود، بدینصورت که متن به طور کامل خوانده و فهمیده شود و با تشخیص و تفکیک قسمت های مهم و غیرمهممتن، نسخه خلاصه شده متن اصلی تولید گردد.هدف از خلاصه سازی خودکار سند، تولید یک نسخه مختصرتر از سند اصلی توسط یک برنامهرایانه ای به نحوی که ویژگی ها و نکات اصلی سند اولیه حفظ شود.بنابر تعریف ارائه شده در استاندارد215 ISO ، خلاصه یک بازگویی مختصر از سند می باشد. روش های تولید خلاصه را با توجه بهانواع دیدگاه های مختلف خلاصه سازی می توان به چندین دسته تقسیم بندی نمود، به عنوان مثالروش تولید خلاصه تک سندی و چند سندی، تک زبانه و چند زبانه، مبتنی بر تعامل با کاربر و غیرمبتنی بر تعامل با کاربر و... لیکن با توجه به اهمیت فاکتور خروجی در تولید خلاصه در این مقاله بهبررسی روش های تولید خلاصه گزینشی (استخراجی) و چکیده ای (مفهومی) پرداخته می شود.

کلمات کلیدی:
پردازش زبان طبیعی، خلاصهسازهای ماشینی، روابط کلامی ، تشابه معنایی، شبکهواژگان

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/451150/