CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه راهکار مبتنی بر یادگیری ماشین برای پیش بینی بدافزار فایل های PDF به کمک الگوریتم های درخت تصمیم

عنوان مقاله: ارائه راهکار مبتنی بر یادگیری ماشین برای پیش بینی بدافزار فایل های PDF به کمک الگوریتم های درخت تصمیم
شناسه ملی مقاله: CDI20_010
منتشر شده در بیستمین سمپوزیوم بین المللی هوش مصنوعی و پردازش سیگنال در سال 1402
مشخصات نویسندگان مقاله:

ترمه دهقان - دانشگاه گلستان
حسین مومنی - دانشگاه گلستان

خلاصه مقاله:
فایل های PDF به دلیل استفاده گسترده و محبوبیت بین کاربران، مورد مناسبی برای مهاجمان هستند که کدهای مخرب خود را در آنها جاسازی کنند. با توجه به ساختار پیچیده PDF و پیچیدگی حملات، بخش بزرگی از سیستم های تشخیص خودکار فعلی قادر به شناسایی موثر فایل های PDF با محتوای مخرب پنهان نیستند. همچنین بسیاری از کارهای پیشنهادی از صحت و دقت لازم در شناسایی بدافزارها برخوردار نیستند. برای حل این مساله، مقاله پیش رو سعی دارد با بهره گیری از راهکارهای یادگیری ماشین، راه حلی را برای پیش بینی بدافزارهای PDF با تحلیل بخش های مختلف یک سند PDF ارائه نماید. در راهکار پیشنهادی، ابتدا از روش CHAID برای رشد درخت تصمیم استفاده خواهیم نمود و در گام بعدی از الگوریتم درخت تصمیم CART استفاده خواهد شد. ارزیابی نتایج نشان دهنده دقت الگوریتم CHAID در پیش بینی بدافزار به میزان ۹۴.۶۹% می باشد و همچنین دقت روش CART در تشخیص و پیش بینی بدافزار ۹۵.۹۲% است.

کلمات کلیدی:
بدافزار PDF، تشخیص بدافزار، تشخیص PDF مخرب، یادگیری ماشین، درخت تصمیم

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1948236/