CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

روش ترکیبی جدید بر پایه وزن دهی و الگوریتم رتبه بندی متون برای تشخیص نویسنده متن

عنوان مقاله: روش ترکیبی جدید بر پایه وزن دهی و الگوریتم رتبه بندی متون برای تشخیص نویسنده متن
شناسه ملی مقاله: CECCONF20_050
منتشر شده در بیستمین کنفرانس ملی علوم و مهندسی کامپیوتر و فناوری اطلاعات در سال 1402
مشخصات نویسندگان مقاله:

محمد غفاری آثار - دانشجوی کارشناسی ارشد، نرم افزار کامپیوتر، دانشگاه البرز، آبیک
رضا مرادی - دکتری مهندسی کامپیوتر، گرایش هوش مصنوعی، استادیار دانشگاه دانش البرز

خلاصه مقاله:
امروزه استفاده از وب به یکی از عناصر حیاتی زندگی انسانی تبدیل شده است. به همین دلیل حجم اطلاعاتی متنی در هر سطح به طرز چشم گیری افزایش یافته است. از این رو، در حال حاضر بیش از هر زمان دیگری نیاز به سیستم های پردازشگر زبان مانند، بازیابی کننده های اطلاعات، خلاصه سازها، مترجم ها و ... احساس می شود. همچنین؛ شناسایی نویسنده متن ، تلاشی است برای بدست آور دن خصوصیات نویسنده یک متن و مقایسه آنها با ویژگی های متون مختلفی که توسط چندین فرد نوشته شده است و به صورت تلفیقی از زبانشناسی و داده کاوی میباشد. در این پژوهش از رویکرد وزن و رتبه دهی جهت تشخیص نویسنده استفاده شده است. ابتدا تمام ویژگی های موجود در متن به بردار تبدیل شده و در مرحله بعد بر اساس روش TF-IDF به تمام ویژگی های استخراج شده وزنی اختصاص داده می شود و ویژگی هایی با وزن بالاتر به مرحله بعدی ارسال می شوند. سپس بر اساس معیار شباهت کسینوسی میزان شباهت متن ورودی با تمام متن های با امتیاز بالا بدست آمده و در نهایت براساس مدل گرافی متون مرتب سازی شده و متنی که بیشترین شباهت با متن ورودی را داشته باشد انتخاب می گردد و نویسنده آن بعنوان خروجی در نظر گرفته خواهد شد.

کلمات کلیدی:
تشخیص نویسنده متون ، رتبه‎بندی متون ، شباهت‎یابی ، پایتون.

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1780678/