طراحی مدل ترکیبی برای طبقه بندی داده های نامتوازن در رشته بیمه شخص ثالث

سال انتشار: 1401
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 117

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_IMPCS-3-2_001

تاریخ نمایه سازی: 29 آبان 1401

چکیده مقاله:

بخش عمده پورتفوی صنعت بیمه کشور ایران را رشته بیمه اجباری مسئولیت مدنی دارندگان وسایل نقلیه موتوری زمینی در مقابل اشخاص ثالث، تشکیل داده است. توانایی پیش بینی وقوع و یا عدم وقوع خسارت به ویژه خسارت های جانی نه تنها برای شرکت های بیمه بلکه برای تصمیم گیرندگان در حوزه های افزایش امنیت جاده ها اهمیت بسیاری دارد. به منظور پیش بینی برچسب وقوع یا عدم وقوع خسارت از روش های طبقه بندی استفاده می شود که در واقع یک مساله طبقه بندی نامتوازن است. این نامتوازن بودن شدید، ناشی از ماهیت کسب و کار بیمه است. نامتوازن بودن داده های صنعت بیمه باعث ایجاد چالش های بسیاری در تجزیه و تحلیل داده های مربوطه می شود. در این پژوهش، ما به طبقه بندی داده های نامتوازن بیمه شخص ثالث در یک شرکت بیمه معتبر می پردازیم. در این راستا دو روش ترکیبی برای رفع مشکل نامتوازن بودن داده ها براساس ۵ مدل پایه گاوسین بیز، بردارهای پشتیبان، لجستیک رگرسیون، درخت تصمیم، نزدیکترین همسایگی به منظور طبقه بندی موثرتر داده های مربوطه ارائه می شود. نتایج بدست آمده نشان می دهد که مدل های ترکیبی ارائه شده بهتر از سایر الگوریتم های داده کاوی برای داده های مربوطه جواب می دهند و استفاده از درخت تصمیم در تجمیع مدل های پایه برای ساخت مدل ترکیبی نتایج بهتری نسبت به رای گیری ساده مدل ها ارائه می کند. همچنین ابر پارامتر تعداد مدل های لازم در رای گیری بر اساس استراتژی شرکت قابل تنظیم است. تعداد ویژگی های ثبت شده از بیمه نامه ها در شرکت های بیمه محدود است با تکمیل این ویژگی ها به ویژه اضافه شدن سوابق رانندگی و سایر ویژگی های فردی می توان به مدل بهتری دست یافت.

کلیدواژه ها:

مدل ترکیبی ، داده های نا متوازن ، داده کاوی ، بیمه شخص ثالث

نویسندگان