CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

اراﺋﻪ روﺷﯽ ﺟﻬﺖ ﺧﻼﺻﻪﺳﺎزی خودکار چندسندی ﺑﺎ ﮐﻤﮏ ﺗﮑﻨﯿﮏ فاکتور گیری ﻣﺎﺗﺮﯾﺲ ﻧﺎﻣﻨﻔﯽ (NMF)

عنوان مقاله: اراﺋﻪ روﺷﯽ ﺟﻬﺖ ﺧﻼﺻﻪﺳﺎزی خودکار چندسندی ﺑﺎ ﮐﻤﮏ ﺗﮑﻨﯿﮏ فاکتور گیری ﻣﺎﺗﺮﯾﺲ ﻧﺎﻣﻨﻔﯽ (NMF)
شناسه ملی مقاله: ELECONFK01_019
منتشر شده در اولین کنفرانس ملی برق و کامپیوتر سیستم های محاسباتی توزیع شده و شبکه های هوشمند در سال 1393
مشخصات نویسندگان مقاله:

اعظم مسعودی کیا - دانشجوی کارشناسی ارشد نرم افزار
مهدی اسماعیلی - عضوهئیت علمی دانشگاه آزاد اسلامی واحد کاشان
سیدمحمدرضا لاجوردی - عضو هیئت علمی دانشگاه آزاد اسلامی واحد کاشان

خلاصه مقاله:
با گسترش روز افزون حجم داده ها و اطلاعات، خلاصه سازی خودکار متن نیز با استقبال چشمگیر محققین روبرو شده است. در سالهای اخیر خلاصه سازی چندسندی با اقبال بیشتری مواجه بوده است. یک سیستم خلاصه سازی چندسندی استخراجی، لاصهسازی است که چندین سند به عنوان ورودی دریافت کرده و گزیدهای از جملات سناد اولیه را تولید مینماید. خلاصه خوب باید بیانگر زمینه کلی بوده و ضمن بیان دیدگاه های مختلف وجود در متن ازخوانایی و پیوستگی بالایی برخوردار باشد. در این مقاله با تمرکز به مشکلات اصلی خلاصه سازی چندسندی، یعنی پوشش کامل مطالب اصلی وعدم وجود افزونگی، روشی برای خلاصه سازی ارائه شده است. در مدل پیشنهادی، ابتدا کلمات متن استخراج شده و ماتریس کلمه-سند ساخته میشود. سپس آنها را خوشه بندی کرده و تکنیک nmf روی آن اعمال شده است. سپس جملات مهم استخراج شده و رتبه بندی میشوند. در نهایت خلاصه نهایی تولید میشود. ارزیابی سیستم پیشنهادی بر روی داده های کنفرانس DUC و با استفاده از معیار ارزیابیROUGE صورت گرفته است. نتایج این روش نسبت به میانگین 32 سیستم قدرتمند دنیا که کار خلاصه سازی را انجام دادهاند، بهبود داشته است.

کلمات کلیدی:
خلاصه سازی چندسندی LSA ،NMF خوشه بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/359908/