انتخاب ویژگی در داده های با تعداد نمونه کم و بعد زیاد با استفاده از خوشه بندی ترکیبی

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 559

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

QCEEC01_032

تاریخ نمایه سازی: 3 اردیبهشت 1398

چکیده مقاله:

امروزه با پیشرفت علم و تکنولوژی و ابزارهای فناوری، توانایی بازبینی و ذخیره داده های مهم با حجم وسیع فراهم گشته است و نیاز به علمی جهت جستجو در این داده ها ودریافت نتایج مفید، لازم و ضروری گشته است. داده کاوی، جستجوی خودکار منابع دادهای بزرگ، جهت یافتن الگوها و وابستگی هایی است که تحلیل های ساده آماری قادر به انجام آن نیستند. خوشه بندی یکی از مهمترین شاخه های داده کاوی می باشد که هدف اصلی آن تقسیم بندی اشیاء به گونه ای است که بیشترین شباهت در یک گروه و بیشترین تفاوت با اشیاء گروه های دیگر را دارا باشند. از آنجایی که هرخوشه بندی اولیه، بر اساس یک محک خاص داده ها را خوشه بندی می کند بنابراین از منظر خاص داده، خوشه بندی ترکیبی بر روی چند خصوصیت کار می کند و نتایج بهتری را ارایه می دهد. از آنجایی که خوشه بندی ترکیبی بر روی داده های با ابعاد بالا و نمونه های کوچک هم با مشکلاتی مانند تعداد زیاد ویژگی ها، پاسخگو نبودن تکنیک های خوشه بندی به همه نیازها، بالابودن پیچیدگی زمانی الگوریتم ها و متفاوت بودن تفسیرهایی که از نتایج خوشه بندی ترکیبی می شود مواجه است، به همین جهت این تحقیق روشی معرفی می کند تا بعد داده ها را با استفاده از روش ترانهاده و خوشه بندی کاهش دهد. از آنجایی که بهترین الگوریتم خوشه بندی اولیه وجود ندارد و الگوریتم های مختلف جواب های متفاوت به دست می آورند، خوشه بندی ترکیبی برای بهبود جواب های اولیه معرفی می شود. روش پیشنهادی بر روی چند مجموعه داده، اعمال شده و نتایج نشان می دهد که روش ترانهاده نتایج بهتری نسبت به روش های تصادفی و ترکیب کامل داشته است.

کلیدواژه ها:

خوشه بندی اولیه ، خوشه بندی ترکیبی ، داده کاوی ، تجزیه و تحلیل خوشه بندی

نویسندگان

ابراهیم اکبری

گروه کامپیوتر، واحد ساری، دانشگاه آزاد اسلامی، ساری، ایران

زهرا یعقوبی بریجانی

گروه کامپیوتر، واحد ساری، دانشگاه آزاد اسلامی، ساری، ایران

سید سعید حمیدی

گروه کامپیوتر، واحد ساری، دانشگاه آزاد اسلامی، ساری، ایران

علیرضا یوسف پور

گروه کامپیوتر، واحد قایمشهر، دانشگاه آزاد اسلامی، قایمشهر، ایران