داده کاوی داده های حجم زیاد با روش بسط یافته برای مدل نکاشت کاهش

مراد درخشان; جاسم قاسمی نژاد

داده کاوی داده های حجم زیاد با روش بسط یافته برای مدل نکاشت کاهش

محل انتشار: چهارمین کنفرانس بین المللی تحقیقات پیشرفته در علوم، مهندسی و فناوری

سال انتشار: 1399

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 445

فایل این مقاله در 8 صفحه با فرمت PDF و WORD قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1135792

شناسه ملی سند علمی:

RSETCONF04_008

تاریخ نمایه سازی: 10 دی 1399

چکیده مقاله:

پردازش داده های حجم زیاد وابسته به برنامه نویسی موازی است. تاکنون نگاشت کاهش که یکی از روش های تکراری داده کاوی در الگوریتم خوشه بندی بدون نظارت است در الگوریتم K-means استفاده شده است. اما بهبود مقیاس پذیری و کارایی این الگوریتم همواره یکی از اهداف برای داده کاوی در داده های حجم زیاد است. در اینجا یک الگوریتم بسط افته از مدل K-means پیشنهاد شده است که موجب افزایش کارایی عامل مقیاس پذیری در زمان افزایش حجم داده ها می شود. بطوری که در الگوریتم پیشنهادی، وابستگی مستقیم هر رکورد ساختار با رکورهای وضعیت موجود اعمال می شود. با ایجاد این وابستگی، هزینه های نگاشت کاهش و عملیات آغاز نگاشت تاحد زیادی کاهش می یابد. با توجه به بهبود صورت یافته در الگوریتم K-means و استفاده از روش نگاشت کاهش تکراری، میزان کارایی و مقیاس پذیری تاحد مطلوبی افزایش می یابد و آزمایشات ما این بهبودی نتایج را تایید می کنند.

کلیدواژه ها:

داده کاوی ، داده های حجم زیاد ، نگاشت کاهش تکراری ، برنامه نویسی موازی ، بسط الگوریتم ، K-means ، پردازش توزیعی.

نویسندگان

مراد درخشان

استادیار، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور، تهران، ایران

جاسم قاسمی نژاد

دانشجوی کارشناسی ارشد رشته نرم افزار ،گروه مهندسی کامپیوتروفناوری اطلاعات، دانشگاه پیام نور، تهران، ایران