دسته بندی متون خبری فارسی با استفاده از الگوریتم Naïve Bayes

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 5,436

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IDMC02_134

تاریخ نمایه سازی: 14 فروردین 1388

چکیده مقاله:

امروزه یکی از بزرگترین چالشهای سایتهای خبری دستهبندی خودکار متون خبری است. در این مقاله روشی بر مبنای Naïve Bayes برای دسته بندی متون خبری فارسی ارایه شده است روش Naïve Bayes یکی از معمولترین روشها برای مسائل دستهبندی است. از مهمترین ویژگیهای این روش سادگی آن و مقاوم بودن در برابر خصیصههای نامرتبط است. در روش پیشنهادی دستهبندی متون خبری، برای کاهش فضای خصیصه ازTFV(Term Frequency Variance) استفاده شده است. پس از بررسی نتایج مشاهده گردید که روش پیشنهادی در برابر روشهای دیگر دارای سرعتی بالا و دقتی قابل مقایسه است.