افزایش سرعت کشف تقلب در کلان داده ها با الگوریتم جنگل تصادفی

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ECMM08_025

تاریخ نمایه سازی: 31 فروردین 1402

چکیده مقاله:

امروزه تجارت الکترونیک و پرداخت های الکترونیکی به گونه ای چشم گیر در میان افراد جامعه محبوبیت یافته است. با توجه به فراگیری اینترنت و سیستم های دریافت و پرداخت روز به روز به این محبوبیت افزوده میشود، اما در پس هر تکنولوژی مشکلاتی نیز بوجود می آید که تقلب را مهمترین مشکل این تکنولوژی می توان نام برد که نیازمند برخورد سریع و دقیق است.امروزه با توجه به گسترش روز افزون اطلاعات بهره گیری از روشهایی همچون داده کاوی برای استخراج دانش و اطلاعات نهفته در داده ها، امر ی غیرقابل اجتناب میباشد. بنابراین شناخت، شناسایی و ساخت الگویی برای تراکنش های هر شخص با توجه به سابقه تراکنش او و پیشبینی وضعیت تراکنش فعلی برای اجازه به ادامه تراکنش یا کسب تایید صحت از صاحب حساب و به روز رسانی الگو به جهت بهبود و کنترل بهتر تراکنش ها در آینده می تواند راه کار مناسبی به کمک علم داده کاوی - یادگیری ماشین و کالن داده باشد. موضوع اصلی موجود در این تحقیق، مشکل، نبودن داده های کافی تراکنش های مشتریان بانکها می باشد.سرعت شناسایی تقلب و برخط بودن آن یکی از عوامل مهم در پیشگیری بوده که در این تحقیق سعی کردیم با استفاده از یافتن ارتباط و نزدیکی داده ها، با استفاده از تکنیکهای پیش پردازش داده K-Means و سپس با استفاده از الگوریتم جنگل تصادفی و به کمک ابزارهای برخط پردازش داده به سرعت نسبتا بیشتری در کشف و تشخیص تقلب دست یابیم. در این پژوهش ما توانستیم سرعت را در بازه ۱.۰۴ درصد تا دوازده درصد افزایشدهیم این در حالی است که دقت تنها در بازه ۱.۱۷ تا ۲.۴۳ درصد کاهش یافته است.

نویسندگان

مهدی سالخورده

کارشناسی ارشد م هندسی کامپیوتر گرایش نرم افزار، دانشگاه آزاد وا حد نیشابور

مینا جم

دانشجوی کارشناسی ارشد مهندسی کامپیوتر گرایش نرم افزار، دانشگاه آزاد واحد نیشابور