CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه روشی براساس شباهت کسینوسی و شبکه واژگان جهت پیداکردن میزان شباهت معنایی بین متون

عنوان مقاله: ارائه روشی براساس شباهت کسینوسی و شبکه واژگان جهت پیداکردن میزان شباهت معنایی بین متون
شناسه ملی مقاله: ICIKT07_112
منتشر شده در هفتمین کنفرانس بین المللی فناوری اطلاعات و دانش در سال 1394
مشخصات نویسندگان مقاله:

معصومه اسلامی نسب - دانشجوی کارشناسی ارشد مهندسی کامپیوتر دانشگاه آزاد اسلامی واحد علوم و تحقیقات فارس
رضا جاویدان - استادیار دانشکده مهندسی کامپیوتر و فناوری اطلاعات ، دانشگاه صنعتی شیراز

خلاصه مقاله:
دراین مقاله روشی برای محاسبه میزان شباهت معنایی متون انگلیسی ارائه شده است. در سال های اخیر اندازه گیری شباهت معنایی مورد توجه پژوهشگران متعددی قرار گرفته است. محاسبه میزان شباهت اسناد در مقالات کاربرد های مختلفی دارد، از جمله: تشخیص سرقت ادبی، تشخیص تکراری بودن متن، خلاصه نویسی متون و ... . در این مقاله از شبکه واژگان برای تعیین مجموعه مترادف ها استفاده شده است. مقالات در سه بخش عنوان، کلمات کلیدی و چکیده تفکیک شده اند و به هر قسمت وزنی اختصاص داده شده است. در روش پیشنهادی ابتدا شباهت هر کدام از قسمت ها دو به دو مقایسه شده اند و سپس نتایج نهایی براساس میانگین وزن داری از قسمت های مختلف محاسبه شده است. نتایج نهایی با امتیازات انسانی مقایسه شده و درجه نزدیکی آن با ضریب همبستگی پیرسون بدست آمده است. ضریب همبستگی بالای 87 درصد نتیجه سیستم پیشنهادی است. سیستم در تشخیص شباهت دقت بالایی دارد.

کلمات کلیدی:
اندازه گیری شباهت معنایی، پیش پردازش متن، شبکه واژگان

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/388754/