CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مقایسه و ارزیابی روش های دسته بندی متون فارسی

عنوان مقاله: مقایسه و ارزیابی روش های دسته بندی متون فارسی
شناسه ملی مقاله: BPJ03_110
منتشر شده در سومین کنفرانس ملی رویکردهای نوین در مهندسی کامپیوتر و برق در سال 1396
مشخصات نویسندگان مقاله:

اصغر کریمی - عضو هیات علمی موسسه آموزش عالی جهاد دانشگاهی اصفهان، ایران
حمیدرضا صدرارحامی - دانشجوی دکتری مهندسی کامپیوتر دانشگاه آزاد اسلامی واحد نجف آباد، اصفهان، ایران

خلاصه مقاله:
امروزه با توجه به افزایش اسناد متنی در محیط های دیجیتال خصوصا در حوزه وب، نیاز به روش های کنترل و مدیریت اسناد بیش از پیش احساس می شود. یکی از کلیدی ترین روش های مدیرت بر متون دیجیتال، متن کاوی است. دسته بندی متون که از زیر شاخه های متن کاوی است می تواند در این مهم نقش شایانی ایفا کند.طبقه بندی و یا دسته بندی متون، وظیفه انتساب اسناد به یکی از دسته های از پیش تعین شده را بر عهده دارد. این موضوع در سال های اخیر توجه زیادی را به خود جلب کرده و روش ها و الگوریتم های زیادی در این باره ابداع شده است. در این مقاله با ذکر الگوریتم های موجود به شرح و بررسی روش های دسته بندی می پردازیم و در نهایت با تمرکز بر روی اسناد فارسی بر اساس پارامترهای استاندارد ارزیابی کاراترین روش را بر اساس تحقیقات انجام گرفته معرفی می کنیم .هدف از انجام این پژوهش معرفی بهترین روش های دسته بندی در متون فارسی است تا کمکی باشد به پژوهشگران این حوزه در انتخاب روش و الگوریتم دسته بندی خودکار متون فارسی.

کلمات کلیدی:
داده کاوی، دسته بندی متون، متن کاوی، واژه های کلیدی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/657908/