تشخیص هرزنامه در اینترنت با استفاده از انتخاب ویژگی مبتنی بر الگوریتم های فراابتکاری

سحر, حسین پناهی; عبدالباقی, قادرزاده

تشخیص هرزنامه در اینترنت با استفاده از انتخاب ویژگی مبتنی بر الگوریتم های فراابتکاری

عنوان مقاله: تشخیص هرزنامه در اینترنت با استفاده از انتخاب ویژگی مبتنی بر الگوریتم های فراابتکاری
شناسه ملی مقاله: ICTI03_066
منتشر شده در سومین کنفرانس ملی فناوریهای نوین در مهندسی برق و کامپیوتر در سال 1398

مشخصات نویسندگان مقاله:

سحر حسین پناهی - کارشناسی ارشد مهندسی کامپیوتر - نرم افزار ، دانشگاه آزاداسلامی واحد سنندج
عبدالباقی قادرزاده - استادیار دانشگاه آزاداسلامی واحد سنندج ، گروه مهندسی کامپیوتر

خلاصه مقاله:

هرزنامه ها یکی از چالش های اینترنت و کاربران آن است. توسط هرزنامه ها انواع بدافزار در اینترنت پخش می شود. از طرفی هرزنامه ها نقش مهمی در سرقت اطلاعات دارند و می توانند شامل لینکهای جعلی برای فریب کاربران باشند. یکی از روش های تشخیص هرزنامه استفاده از روش های یادگیری ماشین و داده کاوی مانند شبکه عصبی مصنوعی است. شبکه عصبی مصنوعی چند لایه برای تشخیص دقیق هرزنامه ها نیاز دارد ویژگی های مهم را به عنوان ورودی در نظر گرفته و خطای خروجی خود را کاهش دهد. در روش پیشنهادی برای انتخاب ویژگی از یک روش هوشمندانه و مبتنی بر الگوریتم های هوش گروهی استفاده شده است. در این پژوهش یک نسخه باینری از الگوریتم بهینه سازی پنگوئن برای انتخاب ویژگی جهت تشخیص هرزنامه ارائه شده است و تلاش شده تا ویژگیهای مهم برای یادگیری و طبقه بندی در تشخیص هرزنامه ارائه شوند. آزمایشات در محیط متلب و بر روی مجموعه داده Spambase نشان می دهند که با افزایش جمعیت خطای روش پیشنهادی در حدود 14٫61٪برای تشخیص هرزنامه از ایمیل کاهش یافته و از طرفی با افزایش جمعیت فضای ویژگی ها در بهترین حالت 43٫85٪کاهش خواهد یافت. آزمایشات نشان میدهند خطای روش پیشنهادی در تشخیص هرزنامه از شبکه عصبی مصنوعی چند لایه، شبکه عصبی بازگشتی، ماشین بردار پشتیبان، شبکه بیزین و الگوریتم بهینه سازی وال کمتر است. آزمایشات نشان می دهند الگوریتم پیشنهادی نسبت به الگوریتم بهینه سازی وال در حدود 23٫57 خطای کمتری در تشخیص هرزنامه دارد. پیاده سازی روش پیشنهادی و سایر روش ها در تشخیص هرزنامه نشان میدهد دقت روش شبکه عصبی مصنوعی چند لایه، شبکه عصبی مصنوعی بازگشتی، ماشین بردار پشتیبان، شبکه بیزین و روش پیشنهادی برای تشخیص هرزنامه به ترتیب برابر 94٫08٪، ٪83٫91، ٪91٫33، 84٫75 و 99٫6 ٪است. آزمایشات نشان میدهند روش های انتخاب ویژگی نظیر درخت تصمیم گیری، جنگل تصادفی، شبکه بیزین و روش پیشنهادی در شاخص دقت به ترتیب دارای مقادیر 98٫4 ٪ ، 97٫20، 76٪ و 99٫ 76٪بوده و روش پیشنهادی بیشترین دقت را دارد.

کلمات کلیدی:

تشخیص هرزنامه، انتخاب ویژگی، الگوریتم های فرا ابتکاری، الگوریتم پنگوئن

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1031241/