رویکردی مبتنی بر خوشه بندی برای طبقه بندی داده های نامتوازن دو کلاسی با استفاده از مفهوم عدم قطعیت
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 899
فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ITCC01_245
تاریخ نمایه سازی: 9 فروردین 1395
چکیده مقاله:
در طبقه بندی، مساله داده های نامتوازن زمانی که مجموعه داده دارای توزیع نابرابر کلاس باشد رخ می دهد. اغلبالگوریتم های طبقه بندی، فرض می کنند که توزیع کلاس ها یکسان است و در صورتی که توزیع کلاس ها نامتوازن باشد،این الگوریتم ها در تشخیص خود دچار مشکل می شوند. در این مقاله، روشی جدید مبتنی بر خوشه بندی ارائه شده است.داده های نامتوازن توسط یک الگوریتم خوشه بندی می شوند، سپس نسبت فراوانی نمونه های اقلیت به نمونه های اکثریتدر هر خوشه محاسبه می گردد. عدد مربوط به هر خوشه برای داده های همان خوشه به عنوان یک ویژگی جدید در نظرگرفته می شود. در مرحله بعد داده ها توسط الگوریتم های استاندارد طبقه بندی با برچسب جدید، طبقه بندی خواهند شد. بااستفاده از ویژگی جدید علاوه بر تعیین دقیق برچسب کلاس یک نمونه، میزان احتمال تعلق به کلاس دیگر نیز بیانمی شود. تست روش بر روی 17 مجموعه داده از پایگاه KEEL انجام شده و سپس با نتایج دو مقاله معتبر مقایسهمی گردد. نتایج نشان می دهد که کارایی طبقه بندی توسط روش پیشنهادی بهبود یافته است.
نویسندگان
ملیحه وضیع
دانشجوی کارشناسی ارشد نرم افزار دانشگاه آزاد اسلامی بیرجند
مصطفی سبزه کار
استاد مدعو دانشگاه آزاد اسلامی بیرجند
حامد وحدت نژاد
عضو هیئت علمی دانشگاه بیرجند
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :