انواع روشهای ردهبندی دادههای نامتوازن و مزایا و معایب آنها

هادی مهدوی نیا; اعظم ربیعی

انواع روشهای ردهبندی دادههای نامتوازن و مزایا و معایب آنها

محل انتشار: سومین همایش ملی برق و کامپیوتر امین

سال انتشار: 1396

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,305

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/642349

شناسه ملی سند علمی:

CECA03_008

تاریخ نمایه سازی: 13 شهریور 1396

چکیده مقاله:

در مواجهه با مجموعه دادهها برای ردهبندی آنها، از نظر توازن، دو نوع داده مشاهده میشود: 1 - دادههای متوازن 1 2 - دادههای نامتوازن 2 . برای ردهبندی دادههای نامتوازن، اگر از روشها و فنون مرسوم و پیشین استفاده شود، مشکلاتی از قبیل: استخراج مدل جانبدارانهی متمایل بهدادههای آموزشی، ردهبندی اشتباه ردهی اقلیت 3 ، صرفنظر کردن از دادههای ردهی اقلیت و بیشپوشش 4 به وجود خواهد آمد؛ بنابراین باید از فنون خاصی برای ردهبندی دادههای نامتوازن استفاده شود. برای ردهبندی دادههای نامتوازن، از رویکرد سطح داده 5 ، رویکرد سطح الگوریتم 6 ،رویکرد یادگیری حساس به هزینه 7 یا رویکرد یادگیری گروهی 8 ، استفاده میشود که با توجه به مجموعهی دادهها و اهداف مورد نظر، یکی از رویکردها انتخاب میشود. در این تحقیق انواع روشهای ردهبندی مجموعه دادههای نامتوازن، و همچنین مزایا و معایب هر کدام بررسی میشوند

کلیدواژه ها:

دادههای نامتوازن ، رده اکثریت 9 ، رده اقلیت ، ردهبندی

نویسندگان

هادی مهدوی نیا

دانشگاه آزاد اسلامی، واحد دولت آباد، گروه کامپیوتر، اصفهان، ایران

اعظم ربیعی

باشگاه پژوهشگران جوان و نخبگان، واحد دولت آباد، دانشگاه آزاد اسلامی، اصفهان، ایران