بررسی اثر توازن مجموعه داده بر عملکرد الگوریتم های طبقه بندی دودویی

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,329

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CECCONF15_009

تاریخ نمایه سازی: 9 خرداد 1401

چکیده مقاله:

امروزه بسیاری از مجموعه داده های مورد استفاده در حل مسائل طبقه بندی با روش های یادگیری ماشین از توزیع یکسانی میان کلاس ها برخوردار نیستند . این موضوع ممکن است موجب کاهش دقت عملکرد مدل های یادگیری ماشین شود. این مطالعه به بررسی اثر مجموعه داده نامتوازن بر عملکرد این روش ها می پردازد. مسئله مورد مطالعه در این پژوهش تشخیص تقلب در تراکنش های بانکی و الگوریتم مورد استفاده رگرسیون لجستیک است. نتایج این پژوهش نشان از تاثیر بسزای توازن داده بر عملکرد مدل است به گونه ای که عملکرد مدل مطابق معیار ارزیابی پوشش در هنگام استفاده از مجموعه داده نامتوازن از ۹۸ به ۵۸ درصد کاهش یافته است.

نویسندگان

پرهام صدری

دانشجوی کارشناسی ارشد، مدیریت کسب و کار، مدیریت سیستم های اطلاعاتی و فناوری اطلاعات، دانشگاه علامه طباطبایی تهران

سیدحسام الدین قشمی

دانشجوی کارشناسی ارشد، مهندسی هوافضا، فناوری ماهواره، دانشگاه تهران