ارزیابی فنون طبقه بندی در تشخیص وب سایت های جعلی مبتنی بر داده کاوی

سال انتشار: 1395
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,125

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CBCONF01_0169

تاریخ نمایه سازی: 16 شهریور 1395

چکیده مقاله:

کشف دانش از مجموعه داده های بزرگ، حاصل پردازش های متنوعی با نام داده کاوی است. امروزه کاربرد داده کاوی درحوزه های حساسی همچون امنیت بسیار رو به گسترش است. وب سایت های جعلی به دلیل تعداد عظیم تراکنش هایبرخطی که روزانه صورت می گیرد، یکی از چالش های امنیتی مهم برای جامعه رایانه ای است. از سوی دیگر، با توجه به روندافزایشی تعداد این وب سایت ها نیاز به راه حل های هوشمند بیش از پیش احساس می شود. در همین راستا، استفاده ازالگوریتم ها طبقه بندی به منظور پیش بینی، در حل مسأله تشخیص وب سایت جعلی هم نتایجی دقیق فراهم می کند(احتمال خطاها را کاهش می دهد) و هم سبب صرفه جویی در زمان و هزینه می شود. در این مقاله با استفاده از نرم افزار وکابه ارزیابی الگوریتم های طبقه بندی مختلف برای پیش بینی وب سایت های جعلی می پردازیم. الگوریتم های مورد بررسیشامل درخت تصمیم J48 ، بیزی ساده، شبکه عصبی چندلایه، جنگل تصادفی، ماشین بردار پشتیبان و AdaBoost است ومجموعه داده انتخابی از مخزن مجموعه داده های یادگیری ماشین دانشگاه کالیفرنیا با نام مجموعه داده وب سایت های جعلیانتخاب شده است. نتایج حاصل از اجرای الگوریتم ها نشان می دهد که الگوریتم جنگل تصادفی از نظر دقت و زمان ساختمدل از سایر الگوریتم ها بهتر است.

کلیدواژه ها:

طبقه بندی ، داده کاوی ، جعل وب سایت ، الگوریتم درخت تصمیم J48 ، الگوریتم شبکه عصبی چندلایه ، ماشین بردار پشتیبان ، نرم افزار وکا

نویسندگان

زینب نظامی

دانشجوی دکتری، دانشکده مهندسی کامپیوتر (نرم افزار)، دانشگاه اصفهان، اصفهان

احمد براآنی دستجردی

دانشیار، دانشکده مهندسی کامپیوتر (نرم افزار)، دانشگاه اصفهان، اصفهان

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Liu, Jiming, and Yiming Ye. "Introduction to E-Commerce Agents: Marketplace ...
  • Dhamija, Rachna, and J. Doug Tygar. "The battle against phishing: ...
  • Abdelhamid, Neda, Aladdin Ayesh, and Fadi Thabtah. "Phishing detection based ...
  • S angl erdsinlapachai, Nuttpong, and Arnon Rungsawang. "Using domain top-page ...
  • Miyamoto, Daisuke, Hiroaki Hazeyama, and Youki Kadobayashi. "An evaluation of ...
  • Abdelhamid, Neda, Aladdin Ayesh, and Fadi Thabtah. "Associative classification mining ...
  • Hall, Mark, et al. "The WEKA data mining software: an ...
  • V aithiyanathan, V., et al. "Comparison of different classification techniques ...
  • Zak, Stanislaw H. Systems and control. New York: Oxford University ...
  • Hassoun, Mohamad H. Fundamentals of artificial neural networks. MIT press, ...
  • Powers, David Marti. "Evaluation: from precision, recall and F-measure to ...
  • Brodersen, Kay H., et al. "The balanced accuracy and its ...
  • Lichman, M. (2013). UCI Machine Learning Repository [http ://archive .ics.uci.du/m] ...
  • نمایش کامل مراجع