تکنیک های داده کاوی برای کاوش دانش در مجموعه داده های بزرگ
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,647
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICCONF01_087
تاریخ نمایه سازی: 14 آذر 1394
چکیده مقاله:
درهرجهان واقعی یک حجم وسیعی ازاطلاعات وجود دارد بنابراین اداره نمودن موثر این داده ها یک مسئله چالش برانگیز و قابل توجه است ازاین رو دراین مقاله ابتدا یک ترکیبی ازالگوریتم k-means موازی و روش رابط انتقال پیام MPI به نام Mkmeans ارایه میشود سپس یک متدولوژی برای کشف مکعبهای علاقه مندی ها درپایگاه داده های چندبعدی و بزرگ ارایه میشود درمتدلوژی پیشنهادی ازتکنیکهای تحلیل مولفه اصلی PCA و تحلیل تناظر چندگانه MCA به منظور کاهش داده استفاده میشود این رویکرد برخلاف تحقیقات گذشته به یک دامنه خاصی ازدانش تکیه ندارد مراحل این متدلوژی عبارتنداز: خوشه بندی کل پایگاه داده با استفاده ازالگوریتم سلسله مراتبی متراکم شونده /اعمال تکنیکهای تحلیل مولفه اصلی PCA برروی متغیرهای عددی و تحلیل تناظر چندگانه MCA برروی متغیرهای اسمی /ایجادشمار چندبعدی /ایجادمکعب داده بامعنی /استخراج دانش ازطریق مسیرهای درجه بالا /این متدلوژی روی یک مجموعه داده واقعی پیاده سازی شده است نتایج ازمایشی نشان میدهد که ازنظر اماری و کاربردی بسیارمفید می باشد الگوریتم ترکیبی Mkmeans درمحیطهای موازی بسیارمفید و کاربردی است نتایج ازمایشی نشان میدهد که این الگوریتم ترکیبی نسبتا پایدار وقابل حمل است و برای حجم بالای داده ها مرتبه زمانی پایینی دارد
کلیدواژه ها:
الگوریتم ترکیبی Mkmeans ، روش انتقال پیام ، تکنیک تحلیل مولفه اصلی ، تکنیک تحلیل تناظر چندگانه ، الگوریتم k-means موازی
نویسندگان
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :