ارائه یک روش جدید برای تخمین مقادیر گمشده در مجموعه داده
محل انتشار: فصلنامه مدل سازی در مهندسی، دوره: 16، شماره: 55
سال انتشار: 1397
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 442
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JME-16-55_012
تاریخ نمایه سازی: 21 اسفند 1399
چکیده مقاله:
اغلب مجموعه داده های مربوط به داده کاوی و ماشین یادگیری دارای داده هایی با مقادیر Missing Values یا داده گمشده می باشند. چگونگی برخورد با داده گمشده و نیز ارائه راهکارهایی مبتنی بر تخمین مقدار مربوط به داده گمشده، منجر به بروز یک مسئله بسیار مهم در زمینه داده کاوی و ماشین یادگیری شده است. در بین الگوریتم های داده کاوی، الگوریتم C4.5، به دلیل کارآیی، استفاده در کاربردهای مختلف داده کاوی و نیز توانایی در کار کردن و تخمین مقدار داده گمشده در مجموعه داده ها، به طور مکرر مورد استفاده قرار گرفته است. پژوهشگران و محققان روش ها و الگوهای متعددی جهت برخورد با مقادیر داده گمشده و تخمین مقدار آن در مجموعه داده های الگوریتم C4.5 ارائه داده اند که هر یک از روش ها به نحوی موجب افزایش دقت درخت تصمیم و در نتیجه تولید یک درخت تصمیم موثر و کاراتر شده است. لذا در مقاله حاضر ابتدا به بررسی و مرور روش ها و راهکارهای ارائه شده پیشین و سپس به ارائه روش پیشنهادی با عنوان روش جابجایی خصوصیت ها جهت تخمین مقادیر گمشده در مجموعه داده پرداخته خواهد شد و سپس در پایان به مقایسه و ارزیابی دقت حاصل شده روش پیشنهادی با روش های حذف و میانگین خواهیم پرداخت.
کلیدواژه ها:
نویسندگان
سلیمه ضیاالدینی
کرمان
مینا ابارقی
کرمان
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :