تشخیص سرقت علمی در متون بازنویسی شده براساس شاخص گذاری با استفاده از شبكه واژگان فارسی

میلاد سرانجام; وحید رستمی

تشخیص سرقت علمی در متون بازنویسی شده براساس شاخص گذاری با استفاده از شبكه واژگان فارسی

محل انتشار: چهارمین کنفرانس بین المللی تحقیقات بین رشته ای در مهندسی برق، کامپیوتر، مکانیک و مکاترونیک در ایران و جهان اسلام

سال انتشار: 1399

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 462

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1184161

شناسه ملی سند علمی:

ECMM04_045

تاریخ نمایه سازی: 1 اردیبهشت 1400

چکیده مقاله:

گسترش روز افزون اینترنت، دسترسی به ایده ها، مقالات، مستندات و دست نوشته های دیگران آسان تر گردیدهاین امر موجب تبادل سریع اطلاعات و در مقابل، سبب آسان تر شدن سرقت ادبی یا Plagiarism شدهاست. عموماً روش های اندازه گیری تشابه متن مبتنی بر بردار تکرار واژه، روابط معنایی بین کلمات را نادیدهمی گیرند، که در واقع مانعی برای محاسبه شباهت متن، در ابعاد بالا و پراکندگی بیشتر بردار سند می باشد. برایغلبه بر این مشکلات، از تجزیه مقادیر منفرد (SVD) برای کاهش ابعاد و حذف نویزهای مدل ارائه متن استفادهمی شود. مقدار بهینه مقادیر منفرد محاسبه می شود و ارتباط معنایی بین کلمات را می توان در فضای معناییساخته شده محاسبه کرد. در این پژوهش یک الگوریتم ساخت شاخص معکوس (TF-IDF) و تعاریف مشابه بینبردارها برای محاسبه شباهت بین دو سند در سطح معنایی پیشنهاد شده است. جهت ارزیابی کارائی الگوریتم، ازمجموعه داده مسابقات plagdet2016 مرکز تحقیقات مخابرات ایران استفاده شده است. در ادامه، نتایج تجربیدر مورد مجموعه ی متنی مورد ارزیابی شده نشان می دهد که الگوریتم پیشنهادی معیارهای ارزیابی کارایی مانند را افزایش می دهد.

کلیدواژه ها:

سرقت متن ، ارتباط معنایی ، تجزیه مقادیر منفرد ، اندازه گیری تشابه متن ، LSA

نویسندگان

میلاد سرانجام

دانشکده مهندسی کامپیوتر و فناوری اطلاعات، واحد قزوین، دانشگاه آزاد اسلامی، قزوین، ایران

وحید رستمی

دانشکده مهندسی کامپیوتر و فناوری اطلاعات، واحد قزوین، دانشگاه آزاد اسلامی، قزوین، ایران