خوشه بندی داده ها، مروری بر روش های موجود و مقایسه عملکرد آن ها

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 4,966

فایل این مقاله در 25 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCC01_012

تاریخ نمایه سازی: 9 فروردین 1395

چکیده مقاله:

یکی از مهمترین اعمال در داده کاوی خوشه بندی داده های موجود در یک دیتاست می باشد. این تکنیک به دنبال کشف ساختارهایی بوده که منجر به گروه بندی نمونه های موجود در یک پایگاه داده بوده، به گونه ای که نمونه های مشابه درون دسته هایی که بیشترین شباهت را با هم داشته قرار گرفته، در حالی که دارای تفاوتی قابل قبول با نمونه های سایر گروه ها داشته باشند. الگوریتم های خوشه بندی را می توان به چند دسته کلی الگوریتم های خوشه بندی تفکیکی، سلسله مراتبی، مبتنی بر چگالی و مبتنی بر گرید تقسیم نمود. این تحقیق ابتدا به مرور روش های خوشه بندی مطرح پرداخته و چند الگوریتم از هر روش را معرفی کرده است. در ادامه همچنین به معرفی روش های دیگری از جمله روش های خوشه بندی مبتنی بر الگوریتم های فرا ابتکاری و خوشه بندی های آنلاین پرداخته شده و سپس چالش های موجود در خوشه بندی از قبیل انتخاب تعداد بهینه خوشه ها، کاهش ابعاد، مدیریت داده های پرت و روشهای مقابله با آنها معرفی شده اند. در نهایت روش ها و الگوریتم های موجود از نظر برخی از پارامترها مقایسه شده و به بررسی مزایا و معایب هر الگوریتم پرداخته شدهاست.

نویسندگان

محمود شاکری

دانشگاه جامع علمی کاربردی واحد جهاد دانشگاهی مشهد

محمد عبدالهی

دانشگاه جامع علمی کاربردی واحد جهاد دانشگاهی مشهد

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • "داده کاوی پیشرفته، _ دکتر جمال شهرابی، مهندس علی ذوالقدر ...
  • Pavel Berkhin "Survey of Clustering Data Mining Techniques", Accrue Software, ...
  • Paul S. Bradley, Usama M. Fayyad, (1998), "Refining Initial Point ...
  • D. Hand, H. Mannila, P. Smyth, (20 01).Principles of Data ...
  • Jeffery W. Seifert, (2004) _ Analyst in information science and ...
  • http : //www. ecg-pnum. ir/thes is/index _ php ?page s=thes ...
  • Ahmadi A, Karry F, Kamel M, (2009), "Flocking based approach ...
  • Pradeep R, Singh S, (2010), _ survey of clustering technigues", ...
  • نمایش کامل مراجع