شناسایی ویژگی ها و شاخص هایی برای تشخیص پیش بینی هوشمند ریزش مشتریان

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 151

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CONFME07_084

تاریخ نمایه سازی: 20 آبان 1400

چکیده مقاله:

در این مقاله به طور عمده بر روی روش های کاهش ویژگی یا ابعاد مانند تجزیه و تحلیل مولفه اصلی (PCA) ، آتوانکدر (AutoEncoder) ، تجزیه و تحلیل افتراقی (LDA) ، توزیع تی T-sne) (، و همچنین انتخاب ویژگی های مهم الگوریتم تقویت کننده شدید گرادیان (Xgboost) پرداخته شده است. هدف این مقاله ارائه یک مدل گروهی ترتیبی پیش بینی ریزش مشتریان براساس الگوریتم های تقویت کننده گرادیان (مانند تقویت کننده شدید گرادیان (Xgboost) و تقویت کننده ضعیف گرادیان (Light GBM) ) است. مدل ارائه شده به طور کلی شامل چهار مرحله است: یک انجام پیش پردازش داده برای استاندارد کردن و از بین بردن داده های فراموش شده و نویزی، دو یک سیستم جامع کاهش ابعاد براساس مدل های محبوب کاهش ابعاد و در نتیجه انتخاب بهترین آن ها، سه تنظیم کردن ابرپارامتر هایالگوریتم های تقویت کننده با استفاده از بهینه سازی بیزین و بهینه سازی ژنتیک و چهار تفسیر مدل و تاثیر ویژگی ها با استفاده از روش اهمیت ویژگی های تقویت کننده شدید گرادیان Xgboost و شپ (Shap) است. علاوه بر مقایسه و یافتن بهترین کاهش ابعاد دهنده، روش پیشنهادی بر روی چهار مجموعه داده معروف در صنعت پیاده سازی و برتری خود را نسبت به روش های عادی گروهی و الگوریتم های یادگیری ماشین مانند آدابوست (Adaboost) ، ماشین پشتیبان بردار (SVM) ، درخت تصمیم با استفاده از هفت معیار ارزیابی مهم مانند: دقت، ناحیه زیر منحنی (AUC) ، کاپا،بریر Brier ، ضریب همبستگی متیوز ( MCC )، نمره F۱ و حداکثز انتظار سودآوری مدل ریزش (EMPC) نشان داده است.همچنین مدل ارائه شده تغییرات بسیار خوبی را در نحوه مواجه مدل با مجموعه داده نامتوازن را در معیار های ارزیابی نشان می دهد

نویسندگان

سیدمحمدسینا میرعبدالباقی

دانش آموخته کارشناسی ارشد، مهندسی صنایع گرایش سیستم های اطلاعاتی. دانشگاه شهیدبهشتی.تهران . ایران.