بررسی اثر توازن مجموعه داده بر عملکرد الگوریتم های طبقه بندی دودویی
سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,329
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CECCONF15_009
تاریخ نمایه سازی: 9 خرداد 1401
چکیده مقاله:
امروزه بسیاری از مجموعه داده های مورد استفاده در حل مسائل طبقه بندی با روش های یادگیری ماشین از توزیع یکسانی میان کلاس ها برخوردار نیستند . این موضوع ممکن است موجب کاهش دقت عملکرد مدل های یادگیری ماشین شود. این مطالعه به بررسی اثر مجموعه داده نامتوازن بر عملکرد این روش ها می پردازد. مسئله مورد مطالعه در این پژوهش تشخیص تقلب در تراکنش های بانکی و الگوریتم مورد استفاده رگرسیون لجستیک است. نتایج این پژوهش نشان از تاثیر بسزای توازن داده بر عملکرد مدل است به گونه ای که عملکرد مدل مطابق معیار ارزیابی پوشش در هنگام استفاده از مجموعه داده نامتوازن از ۹۸ به ۵۸ درصد کاهش یافته است.
کلیدواژه ها:
نویسندگان
پرهام صدری
دانشجوی کارشناسی ارشد، مدیریت کسب و کار، مدیریت سیستم های اطلاعاتی و فناوری اطلاعات، دانشگاه علامه طباطبایی تهران
سیدحسام الدین قشمی
دانشجوی کارشناسی ارشد، مهندسی هوافضا، فناوری ماهواره، دانشگاه تهران