ارائه راهکار مبتنی بر یادگیری ماشین برای پیش بینی بدافزار فایل های PDF به کمک الگوریتم های درخت تصمیم

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 30

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CDI20_010

تاریخ نمایه سازی: 18 فروردین 1403

چکیده مقاله:

فایل های PDF به دلیل استفاده گسترده و محبوبیت بین کاربران، مورد مناسبی برای مهاجمان هستند که کدهای مخرب خود را در آنها جاسازی کنند. با توجه به ساختار پیچیده PDF و پیچیدگی حملات، بخش بزرگی از سیستم های تشخیص خودکار فعلی قادر به شناسایی موثر فایل های PDF با محتوای مخرب پنهان نیستند. همچنین بسیاری از کارهای پیشنهادی از صحت و دقت لازم در شناسایی بدافزارها برخوردار نیستند. برای حل این مساله، مقاله پیش رو سعی دارد با بهره گیری از راهکارهای یادگیری ماشین، راه حلی را برای پیش بینی بدافزارهای PDF با تحلیل بخش های مختلف یک سند PDF ارائه نماید. در راهکار پیشنهادی، ابتدا از روش CHAID برای رشد درخت تصمیم استفاده خواهیم نمود و در گام بعدی از الگوریتم درخت تصمیم CART استفاده خواهد شد. ارزیابی نتایج نشان دهنده دقت الگوریتم CHAID در پیش بینی بدافزار به میزان ۹۴.۶۹% می باشد و همچنین دقت روش CART در تشخیص و پیش بینی بدافزار ۹۵.۹۲% است.

نویسندگان

ترمه دهقان

دانشگاه گلستان

حسین مومنی

دانشگاه گلستان