CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارزیابی ویژگی ها برای تشخیص بازدیدکنندگان مخرب و غیر مخرب وب سایت ها مبتنی بر روش های داده کاوی

عنوان مقاله: ارزیابی ویژگی ها برای تشخیص بازدیدکنندگان مخرب و غیر مخرب وب سایت ها مبتنی بر روش های داده کاوی
شناسه ملی مقاله: AISST01_142
منتشر شده در همایش ملی کاربرد سیستم های هوشمند (محاسبات نرم) در علوم و صنایع در سال 1392
مشخصات نویسندگان مقاله:

سوده لایقی - دانشگاه آزاد اسلامی واحد مشهد گروه کامپیوتر نرم افزار
امیرحسین زارعی - دانشگاه آزاد اسلامی واحد مشهد گروه کامپیوتر نرم افزار
مجید وفایی جهان - دانشگاه آزاد اسلامی واحد مشهد گروه کامپیوتر نرم افزار
مهرداد جلالی - دانشگاه آزاد اسلامی واحد مشهد گروه کامپیوتر نرم افزار

خلاصه مقاله:
در این مقاله بازدیدکنندگان وب سایت ها به چهار گروه انسان، روبات وب با رفتار خوب، روبات وب با رفتار مخرب و بازدیدکنندگان ناشناخته تقسیم بندی شده است. روبات های وب یا خزنده های وب برنامه های نرم افزاری هستند که دائماً به صورت خودکار ساختار لینک های وب سایت ها را مورد پیمایش قرار می دهند. هدف روبات های وب کشف و بازیابی محتوا و دانش از وب می باشد. این روبات ها هم به منظور اعمال مفیدی مانند کشف لینک های خراب و هم اعمال مخربی مانند حمله توزیع شده مختل کننده سرویس طراحی شده اند. تشخیص و دسته بندی روبات های وبی که تلاش در تقلید رفتار انسان دارند به عنوان مهم ترین چالش دسته بندی است. در این مقاله برای تشخیص بازدیدکنندگان مخرب و غیر مخرب وب سایت ها سه ویژگی جدید معرفی شده است. ویژگی های بیان شده در مقالات گذشته بعلاوه سه ویژگی جدید با استفاده از روش های شبکه عصبی، ماشین بردار پشتیبان، C4.5، شبکه بیزین و شبکه باور بیزی مقایسه شده است. استخراج ویژگی های جدید برای تشخیص بازدیدکنندگان وب سایت ها باعث شد که دقت دسته بندی در مقایسه با روش های دیگر با ویژگی های کمتر، بهبود یابد و همچنین نشان داده شده است هر چه تعداد مجموعه داده آموزش بیشتر باشد دقت دسته بندی بهتر خواهد بود.

کلمات کلیدی:
روبات های وب، روش های داده کاوی، فایل ثبت وقایع، کاربرد کاوی وب

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/206316/