داده کاوی با الگوریتم های یادگیری ماشین

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 126

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

COMCONF08_196

تاریخ نمایه سازی: 5 شهریور 1401

چکیده مقاله:

داده کاوی (Data Mining) علم استخراج الگوها، اطلاعات و تحلیل از مجموعه داده های خامی است که در یک سازمان و یا یک جامعه یا هر مجموعه دیگری تولید شده است. به جرات می توان گفت از زمانی که دانش داده کاوی و یا تحلیل داده پا به میدان گذاشت، ارزش داده در دنیای امروز متحول شد. سالیان پیش که حجم داده های تولیدی بسیار محدود بود، بسیاری از مدیران با نگاهی سطحی و با جداسازی دستی داده ها، می توانستند به مفاهیمی که در پس آن ها بود پی ببرند. اما زمانی که با حجم عظیمی از داده مواجه شویم، عملا این کار غیرممکن است و توان محدود هیچ انسانی، پاسخگوی تحلیل این داده ها و استخراج الگوهای آن نخواهد بود. اکنون علم داده کاوی بستری فراهم کرده است که بتوان با به کارگیری فناوری های جدیدی مانند یادگیری ماشین و… متناسب با اهداف مشخص، به دسته بندی، تحلیل و استخراج مفاهیم نهفته در داده ها پرداخت و از آنها برای اتخاذ تصمیمات مهم استفاده کرد. اما آنچه باعث شده علم داده کاوی تا این حد مورد توجه قرار بگیرد، ضریب اطمینان بالای تصمیمات اتخاذ شده بر اساس تحلیل های داده ای و نتایجی است که ایجاد می شود. زمانی که مدیران بر اساس احساسات و شهود اقدام به سیاست گذاری و تصمیم گیری در مورد موضوعی می کنند، احتمال خطا در تشخیص مشکل و ارائه راهکار بسیار زیاد است، در نتیجه ریسک زیادی منابع سازمان را تهدید می کند. درحالی که با تصمیم گیری بر اساس تحلیل های حاصل از داده کاوی، از هدررفت منابع شرکت در یک اقدام ناکارآمد و غیرضروری جلوگیری می شود. داده کاوی به مدیران کمک می کند تا پیش از هرچیزی، دید درستی از جامعه مورد بررسی پیدا کنند و پس از عارضه یابی درست، راهکاری بهینه برای حل آن مشکل ارائه دهند. در این مقاله، از مجموعه داده های بازاریابی بانکی از مخزن یادگیری ماشین استفاده شده است ۸۰ درصد داده ها آموزشی و ۲۰ درصد داده ها آزمایشی می باشند سپس با ایجاد مدل های دسته بندی با الگوریتم های داده کاوی و یادگاری ماشین مانند الگوریتم KNN و C۴.۵ در برنامه RapidMiner معیارهای دقت، صحت و اندازه گیری برای تست عملکرد مدل های دسته بندی مورد استفاده قرار گرفته است.

نویسندگان

زهرا سعدی

گروه مهندسی کامپیوتر، واحد ملایر، دانشگاه آزاد اسلامی، ملایر، ایران