روش ترکیبی جدید بر پایه وزن دهی و الگوریتم رتبه بندی متون برای تشخیص نویسنده متن

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 85

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF20_050

تاریخ نمایه سازی: 24 مهر 1402

چکیده مقاله:

امروزه استفاده از وب به یکی از عناصر حیاتی زندگی انسانی تبدیل شده است. به همین دلیل حجم اطلاعاتی متنی در هر سطح به طرز چشم گیری افزایش یافته است. از این رو، در حال حاضر بیش از هر زمان دیگری نیاز به سیستم های پردازشگر زبان مانند، بازیابی کننده های اطلاعات، خلاصه سازها، مترجم ها و ... احساس می شود. همچنین؛ شناسایی نویسنده متن ، تلاشی است برای بدست آور دن خصوصیات نویسنده یک متن و مقایسه آنها با ویژگی های متون مختلفی که توسط چندین فرد نوشته شده است و به صورت تلفیقی از زبانشناسی و داده کاوی میباشد. در این پژوهش از رویکرد وزن و رتبه دهی جهت تشخیص نویسنده استفاده شده است. ابتدا تمام ویژگی های موجود در متن به بردار تبدیل شده و در مرحله بعد بر اساس روش TF-IDF به تمام ویژگی های استخراج شده وزنی اختصاص داده می شود و ویژگی هایی با وزن بالاتر به مرحله بعدی ارسال می شوند. سپس بر اساس معیار شباهت کسینوسی میزان شباهت متن ورودی با تمام متن های با امتیاز بالا بدست آمده و در نهایت براساس مدل گرافی متون مرتب سازی شده و متنی که بیشترین شباهت با متن ورودی را داشته باشد انتخاب می گردد و نویسنده آن بعنوان خروجی در نظر گرفته خواهد شد.

نویسندگان

محمد غفاری آثار

دانشجوی کارشناسی ارشد، نرم افزار کامپیوتر، دانشگاه البرز، آبیک

رضا مرادی

دکتری مهندسی کامپیوتر، گرایش هوش مصنوعی، استادیار دانشگاه دانش البرز