انواع روشهای ردهبندی دادههای نامتوازن و مزایا و معایب آنها

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,305

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECA03_008

تاریخ نمایه سازی: 13 شهریور 1396

چکیده مقاله:

در مواجهه با مجموعه دادهها برای ردهبندی آنها، از نظر توازن، دو نوع داده مشاهده میشود: 1 - دادههای متوازن 1 2 - دادههای نامتوازن 2 . برای ردهبندی دادههای نامتوازن، اگر از روشها و فنون مرسوم و پیشین استفاده شود، مشکلاتی از قبیل: استخراج مدل جانبدارانهی متمایل بهدادههای آموزشی، ردهبندی اشتباه ردهی اقلیت 3 ، صرفنظر کردن از دادههای ردهی اقلیت و بیشپوشش 4 به وجود خواهد آمد؛ بنابراین باید از فنون خاصی برای ردهبندی دادههای نامتوازن استفاده شود. برای ردهبندی دادههای نامتوازن، از رویکرد سطح داده 5 ، رویکرد سطح الگوریتم 6 ،رویکرد یادگیری حساس به هزینه 7 یا رویکرد یادگیری گروهی 8 ، استفاده میشود که با توجه به مجموعهی دادهها و اهداف مورد نظر، یکی از رویکردها انتخاب میشود. در این تحقیق انواع روشهای ردهبندی مجموعه دادههای نامتوازن، و همچنین مزایا و معایب هر کدام بررسی میشوند

نویسندگان

هادی مهدوی نیا

دانشگاه آزاد اسلامی، واحد دولت آباد، گروه کامپیوتر، اصفهان، ایران

اعظم ربیعی

باشگاه پژوهشگران جوان و نخبگان، واحد دولت آباد، دانشگاه آزاد اسلامی، اصفهان، ایران