جداسازی هرز نامههای متنی یک رویکرد مبتنی بر الگوریتم ژنتیک و روش دسته بندی SVM
محل انتشار: چهارمین کنفرانس انجمن رمز ایران
سال انتشار: 1386
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,684
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ISCC04_017
تاریخ نمایه سازی: 10 اسفند 1385
چکیده مقاله:
در این مقاله، یک روش ترکیبی الگوریتم ژنتیک برای انتخاب خصیصه و روش دستهبندی svm برای جداسازی نامه های هرز پیشنهاد شده است. روش پیشنهادی روی مجموعه نامه های استاندارد LingSpam ارزیابی شدهاست . نتایج حاصل از ارزیابی نشان می دهد که روش پیشنهادی علاوه بر حفظ و یا بالا بردن معیارهای دقت، فراخوانی وF 1 تعداد خصیصهها را حدوداً به ١%، تعداد اولیه کاهش می دهد. همچنین، مقایسه نتایج حاصل از میانگین دقت، فراخوانی و F1 دسته بندی هرزنامه ب ا روش روش پیشنهادی با روشهایی که ازSVM به همراه یک روش فیلتری انتخاب خصیصه استفاده میکنند و سایر روشهای آماری جداسازی هرزنامهها نشان میدهد که روش پیشنهادی از نظر دقت و فراخوانی قابل مقایسه و حتی در مواردی بهتر بوده است.
کلیدواژه ها:
نویسندگان
سعید جلیلی
دانشگاه تربیت مدرس، گروه کامپیوتر آزمایشگاه یادگیری ماشین
شیما گرانی
دانشگاه تربیت مدرس، گروه کامپیوتر آزمایشگاه یادگیری ماشین