CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

classification درکلان داده

عنوان مقاله: classification درکلان داده
شناسه ملی مقاله: COMCONF01_669
منتشر شده در کنفرانس بین المللی یافته های نوین پژوهشی درمهندسی برق و علوم کامپیوتر در سال 1394
مشخصات نویسندگان مقاله:

مریم بخشی - دانشجوی کارشناسی ارشدمهندسی فناوری اطلاعات دانشگاه علوم و تحقیقات تهران

خلاصه مقاله:
امروزه فرایند استخراج اطلاعات معتبرناشناخته قابل فهم و قابل ا عتمادازمجموعه داده های بزرگ و استفاده ازان درتصمیم گیری و درفعالیت تجاری داده کاوی نامیده میشود همواره دررابطه با تحلیل و بررسی داده های باحجم بالا بامشکل طلسم ابعادوپیچیدگی پایگاه داده مواجه هستیم علم داده کاوی شامل کاربرد ابزاری برای تحلیل داده های مصنوعی و کشف الگوهای ناشناخته معتبر و روابط بین مجموعه های داده وسیع می باشد این ابزار ها میتواند شامل مدلهای اماری الگوریتم های ریاضی و روشهای یادگیری ماشین الگوریتم هایی که بطور خودکار اجرایشان را ازطریق تجربیات بهبود می بخشند ازقبیل شبکه های عصبی یا درختان تصمیم باشد استفاده ازاین الگوریتم ها درمباحث مختلف صنعتی مدییرتی مالی و مهندسی منجر به پیشرفت سازمان درتحلیل داده های وسیع شده است دراین مقاله نیز ابتدا به تعریفی ازکلاس بندی پرداخته و سپس برخی ازانواع الگوریتم های کلاس بندی ازجمله c4.5,bagging,decision tree,naive bays,random forest,svm بیان میشوند ازمیان آنها الگوریتم svm درحال حاضربطور گسترده ای برای مسائل دسته بندی مورداستفاده قرارمیگیرد که شایدبتوان محبوبیت کنونی ماشین بردارپشتیبان رابامحبوبیت شبکه عصبی دردهه گذشته مقایسه کرد و درنهایت به بیان خلاصه ای ازجریان کاری طبقه بندی داده درکلان داده بااستفاده ازابزار mahout پرداختیم

کلمات کلیدی:
طبقه بندی ، الگوریتم های کلاس بندی ، ماشین بردارپشتیبان ، کلان داده ، یادگیری ماشین

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/404768/