CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه یک روش خلاصه سازی خودکار متون تک و چند سندی بر پایه روش گراف

عنوان مقاله: ارائه یک روش خلاصه سازی خودکار متون تک و چند سندی بر پایه روش گراف
شناسه ملی مقاله: KBEI05_009
منتشر شده در پنجمین کنفرانس مهندسی دانش بنیان و نوآوری در سال 1397
مشخصات نویسندگان مقاله:

زینب رودباری مونجی - موسسه آموزش عالی پویندگان دانش شهرستان چالوس چالوس، ایران
رضا طاولی - عضو هیئت علمی تمام وقت دانشگاه آزاد چالوس واحد کامپیوتر چالوس، ایران

خلاصه مقاله:
با توجه به نیاز بشر به اطلاعات مفید و مناسب متون باید بهصورت خودکار پردازش و خلاصه شوند که برای این مهم در طول سال هایاخیر روش های گوناگونی پیشنهاد شده که کمابیش تاثیر گذارند. در اینپروژه یک روش جدید خلاصه سازی مبتنی بر گراف را پیاده سازی میکنیم. در این مقاله سعی بر آن داشتیم تا متون را بررسی و خلاصه کنیم.برای خلاصه کردن در ابتدا متون را پیش پردازش می کنیم. کلمات اضافی راحذف می کنیم و ریشه یابی انجام می دهیم و جایگاه کلمات را مشخص میکنیم. برای یافتن ویژگی ها و به دست آوردن ماتریس کلمات ما از روشTF-ISF بهره مند شدیم و وزن دهی انجام دادیم. برای بدست آوردن جملات هم از گراف استفاده می کنیم برای جملات بر اساس شباهت کلماتمشترکی که دارند امتیاز قائل می شویم و بر اساس آن امتیازات نود هایگراف ما رسم شدند، که نود هایی که بیشترین یال را دارا بودند همانجملات منتخب اند.

کلمات کلیدی:
خلاصه سازی استخراجی، پیش پردازش، روش فراوانی بر معکوس سند، روش گراف

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/988894/