CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه روش جدید نمونه گیری مبتنی بر رتبه بندی نمونه ها و خوشه بندی کاهشی

عنوان مقاله: ارائه روش جدید نمونه گیری مبتنی بر رتبه بندی نمونه ها و خوشه بندی کاهشی
شناسه ملی مقاله: CESD01_028
منتشر شده در همایش مهندسی کامپیوتر و توسعه پایدار با محوریت شبکه های کامپیوتری، مدلسازی و امنیت سیستم ها در سال 1392
مشخصات نویسندگان مقاله:

محبوبه مهدی زاده - دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه شهید باهنر کرمان
مهدی افتخاری - عضو هیات علمی دانشگاه شهید باهنر کرمان

خلاصه مقاله:
در مسائل طبقه بندی تعداد نمونه های هر کلاس می تواند متفاوت باشد در مسائل طبقه بندی باینری، مساله عدم توازن هنگامی رخ می دهد که یک کلاس تعداد نمونه های بسیاری دارد در حالی که کلاس دیگر توسط تعداد نمونه های کمی نمایش داده می شود. در این مقاله بر روی روش های under-sampling (نمونه گیری از داده های با کلاس اکثریت) تمرکز می کنیم در روش پیشنهادی ابتدا با استفاده از روش خوشه بندی کاهشی، نمونه های اکثریت را به تعدادی خوشه تقسیم و سپس با رتبه بندی نمونه های هر خوشه، تعدادی نمونه انتخاب می کنیم. نمونه های اکثریت انتخاب شده با همراه نمونه های اقلیت، مجموعه داده نهایی را تشکیل می دهند. آزمایش را بر روی 20 مجموعه داده از مجموعه داده های KEEL اجرا و سپس نتایج بدست آمده را با استفاده از تست های آماری تحلیل می کنیم. نتایج حاصل نشان می دهد که کارایی الگوریتم طبقه بندی با استفاده از روش پیشنهادی بهبود می یابد.

کلمات کلیدی:
طبقه بندی نامتوازن، رتبه بندی نمونه، خوشه بندی کاهشی، نمونه گیری

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/238855/