CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

انتخاب ویژگی در داده های با تعداد نمونه کم و بعد زیاد با استفاده از خوشه بندی ترکیبی

عنوان مقاله: انتخاب ویژگی در داده های با تعداد نمونه کم و بعد زیاد با استفاده از خوشه بندی ترکیبی
شناسه ملی مقاله: QCEEC01_032
منتشر شده در اولین کنفرانس مهندسی برق و کامپیوتر در سال 1397
مشخصات نویسندگان مقاله:

ابراهیم اکبری - گروه کامپیوتر، واحد ساری، دانشگاه آزاد اسلامی، ساری، ایران
زهرا یعقوبی بریجانی - گروه کامپیوتر، واحد ساری، دانشگاه آزاد اسلامی، ساری، ایران
سید سعید حمیدی - گروه کامپیوتر، واحد ساری، دانشگاه آزاد اسلامی، ساری، ایران
علیرضا یوسف پور - گروه کامپیوتر، واحد قایمشهر، دانشگاه آزاد اسلامی، قایمشهر، ایران

خلاصه مقاله:
امروزه با پیشرفت علم و تکنولوژی و ابزارهای فناوری، توانایی بازبینی و ذخیره داده های مهم با حجم وسیع فراهم گشته است و نیاز به علمی جهت جستجو در این داده ها ودریافت نتایج مفید، لازم و ضروری گشته است. داده کاوی، جستجوی خودکار منابع دادهای بزرگ، جهت یافتن الگوها و وابستگی هایی است که تحلیل های ساده آماری قادر به انجام آن نیستند. خوشه بندی یکی از مهمترین شاخه های داده کاوی می باشد که هدف اصلی آن تقسیم بندی اشیاء به گونه ای است که بیشترین شباهت در یک گروه و بیشترین تفاوت با اشیاء گروه های دیگر را دارا باشند. از آنجایی که هرخوشه بندی اولیه، بر اساس یک محک خاص داده ها را خوشه بندی می کند بنابراین از منظر خاص داده، خوشه بندی ترکیبی بر روی چند خصوصیت کار می کند و نتایج بهتری را ارایه می دهد. از آنجایی که خوشه بندی ترکیبی بر روی داده های با ابعاد بالا و نمونه های کوچک هم با مشکلاتی مانند تعداد زیاد ویژگی ها، پاسخگو نبودن تکنیک های خوشه بندی به همه نیازها، بالابودن پیچیدگی زمانی الگوریتم ها و متفاوت بودن تفسیرهایی که از نتایج خوشه بندی ترکیبی می شود مواجه است، به همین جهت این تحقیق روشی معرفی می کند تا بعد داده ها را با استفاده از روش ترانهاده و خوشه بندی کاهش دهد. از آنجایی که بهترین الگوریتم خوشه بندی اولیه وجود ندارد و الگوریتم های مختلف جواب های متفاوت به دست می آورند، خوشه بندی ترکیبی برای بهبود جواب های اولیه معرفی می شود. روش پیشنهادی بر روی چند مجموعه داده، اعمال شده و نتایج نشان می دهد که روش ترانهاده نتایج بهتری نسبت به روش های تصادفی و ترکیب کامل داشته است.

کلمات کلیدی:
خوشه بندی اولیه، خوشه بندی ترکیبی، داده کاوی، تجزیه و تحلیل خوشه بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/838277/