بهبود کارایی شبکه عصبی کانولووشنال با استفاده از تابع ضرر وزن دار افزایشی برای مقابله با نامتوازنی دسته ای

نسیبه, محمودی; حسین, شیرازی; محمد, فخردانش; کوروش, داداش تبار احمدی

بهبود کارایی شبکه عصبی کانولووشنال با استفاده از تابع ضرر وزن دار افزایشی برای مقابله با نامتوازنی دسته ای

عنوان مقاله: بهبود کارایی شبکه عصبی کانولووشنال با استفاده از تابع ضرر وزن دار افزایشی برای مقابله با نامتوازنی دسته ای
شناسه ملی مقاله: JR_PADSA-11-4_002
منتشر شده در در سال 1402

مشخصات نویسندگان مقاله:

نسیبه محمودی - دانشکده برق و کامپیوتر، دانشگاه صنعتی مالک اشتر
حسین شیرازی - دانشگاه صنعتی مالک اشتر
محمد فخردانش - استادیار، دانشگاه صنعتی مالک اشتر، مجتمع دانشگاهی برق و کامپیوتر، ایران
کوروش داداش تبار احمدی - دانشگاه صنعتی مالک اشتر

خلاصه مقاله:

باتوجه به اینکه بیشتر مسائل دنیای واقعی از قبیل تشخیص تقلب، شناسایی خطا، تشخیص ناهنجاری، تشخیص پزشکی و تشخیص بدافزار نامتوازن هستند، دسته بندی داده ها در مسائل نامتوازن به عنوان یکی از چالش های اصلی در حوزه ی داده کاوی، مورد توجه بسیاری از محﻘﻘان و پژوهشگران قرارگرفته است. در یادگیری نامتوازن، معمولا تعداد نمونه های یکی از دسته ها خیلی بیشتر از نمونههای دسته دیگر است و یا هزینه دسته بندی اشتباه در دو دسته متفاوت است. شبکه های عصبی کانولووشنال به رغم موفقیت های چشمگیری که در دسته بندی داده ها دارند، در مسائل نامتوازن با مشکل مواجه می شوند چرا که آن ها به صورت پیش فرض، توزیع دسته ها را متوازن و هزینه دسته بندی را مساوی در نظر گرفته می گیرند، ازاین رو در دسته بندی نامتوازن، نمی توان به نتایج قابل قبولی دست یافت؛ زیرا شبکه به سمت نمونه های آموزشی دسته بزرگ تر متمایل میشود که این موضوع سبب افزایش تعداد خطاها در تشخیص نمونه های مثبت می شود. یکی از راهکارهای کم هزینه برای غلبه بر نامتوازنی داده ها در شبکه های عصبی کانولوشنال استفاده از تابع ضرر به نفع دسته اقلیت است، در این مقاله تابع ضرری جدیدی معرفی شده است که به صورت تدریجی و با پیشرفت آموزش، اهمیت دسته اقلیت را افزایش می دهد تا در انتهای آموزش به مقدار مشخص شده برسد و از اهمیت داده های دسته اکثریت بکاهد، این امر باعث می شود تا هم بتوانیم از قدرت آموزشی همه داده ها استفاده کنیم و هم از غلبه داده های دسته اکثریت جلوگیری کنیم. نتایج آزمایش روی سه مجموعه داده ی مصنوعی، تشخیص فعالیت های انسان و cifar-۱۰، همگرایی و کارایی روش پیشنهادی را نشان می دهند، روش پیشنهادی با روش های آدابوست مبتنی بر درخت تصمیم، شبکه کانولوشنال مبتنی بر آنتروپی متقابل و آنتروپی متقابل وزن دار، روش SMOTE و روش CNN تجمعی مقایسه شده است. به ترتیب باکسب دقت ۶/۹۴، ۹۲/۹۲ و ۲۳/۶۹ در سه مجموعه داده (Cifar-۱۰ با نرخ نامتوازنی ۵ درصد) توانست از دیگر روش ها پیشی بگیرد. و دقت در مجموعه داده مصنوعی نسبت به روش سنتی آدابوست مبتنی درخت تصمیم، ۷۲/۱۷ بالاتر است.

کلمات کلیدی:

نامتوازنی دسته ای, یادگیری عمیق, تابع ضرر, آنتروپی متقابل

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1941521/