بهبود کارایی شبکه عصبی کانولووشنال با استفاده از تابع ضرر وزن دار افزایشی برای مقابله با نامتوازنی دسته ای

سال انتشار: 1402
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 17

نسخه کامل این مقاله ارائه نشده است و در دسترس نمی باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_PADSA-11-4_002

تاریخ نمایه سازی: 28 اسفند 1402

چکیده مقاله:

باتوجه به اینکه بیشتر مسائل دنیای واقعی از قبیل تشخیص تقلب، شناسایی خطا، تشخیص ناهنجاری، تشخیص پزشکی و تشخیص بدافزار نامتوازن هستند، دسته بندی داده ها در مسائل نامتوازن به عنوان یکی از چالش های اصلی در حوزه ی داده کاوی، مورد توجه بسیاری از محﻘﻘان و پژوهشگران قرارگرفته است. در یادگیری نامتوازن، معمولا تعداد نمونه های یکی از دسته ها خیلی بیشتر از نمونههای دسته دیگر است و یا هزینه دسته بندی اشتباه در دو دسته متفاوت است. شبکه های عصبی کانولووشنال به رغم موفقیت های چشمگیری که در دسته بندی داده ها دارند، در مسائل نامتوازن با مشکل مواجه می شوند چرا که آن ها به صورت پیش فرض، توزیع دسته ها را متوازن و هزینه دسته بندی را مساوی در نظر گرفته می گیرند، ازاین رو در دسته بندی نامتوازن، نمی توان به نتایج قابل قبولی دست یافت؛ زیرا شبکه به سمت نمونه های آموزشی دسته بزرگ تر متمایل میشود که این موضوع سبب افزایش تعداد خطاها در تشخیص نمونه های مثبت می شود. یکی از راهکارهای کم هزینه برای غلبه بر نامتوازنی داده ها در شبکه های عصبی کانولوشنال استفاده از تابع ضرر به نفع دسته اقلیت است، در این مقاله تابع ضرری جدیدی معرفی شده است که به صورت تدریجی و با پیشرفت آموزش، اهمیت دسته اقلیت را افزایش می دهد تا در انتهای آموزش به مقدار مشخص شده برسد و از اهمیت داده های دسته اکثریت بکاهد، این امر باعث می شود تا هم بتوانیم از قدرت آموزشی همه داده ها استفاده کنیم و هم از غلبه داده های دسته اکثریت جلوگیری کنیم. نتایج آزمایش روی سه مجموعه داده ی مصنوعی، تشخیص فعالیت های انسان و cifar-۱۰، همگرایی و کارایی روش پیشنهادی را نشان می دهند، روش پیشنهادی با روش های آدابوست مبتنی بر درخت تصمیم، شبکه کانولوشنال مبتنی بر آنتروپی متقابل و آنتروپی متقابل وزن دار، روش SMOTE و روش CNN تجمعی مقایسه شده است. به ترتیب باکسب دقت ۶/۹۴، ۹۲/۹۲ و ۲۳/۶۹ در سه مجموعه داده (Cifar-۱۰ با نرخ نامتوازنی ۵ درصد) توانست از دیگر روش ها پیشی بگیرد. و دقت در مجموعه داده مصنوعی نسبت به روش سنتی آدابوست مبتنی درخت تصمیم، ۷۲/۱۷ بالاتر است.

نویسندگان

نسیبه محمودی

دانشکده برق و کامپیوتر، دانشگاه صنعتی مالک اشتر

حسین شیرازی

دانشگاه صنعتی مالک اشتر

محمد فخردانش

استادیار، دانشگاه صنعتی مالک اشتر، مجتمع دانشگاهی برق و کامپیوتر، ایران

کوروش داداش تبار احمدی

دانشگاه صنعتی مالک اشتر