ارائه یک نسخه بهبود یافته از الگوریتم K-means بر مبنای الگوکاوی

زهرا هاشمی; مریم امیری

ارائه یک نسخه بهبود یافته از الگوریتم K-means بر مبنای الگوکاوی

محل انتشار: بیست و هشتمین کنفرانس بین المللی کامپیوتر انجمن کامپیوتر ایران

سال انتشار: 1401

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 155

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1623417

شناسه ملی سند علمی:

CSICC28_026

تاریخ نمایه سازی: 27 اسفند 1401

چکیده مقاله:

خوشه بندی یکی از مهم ترین مباحث در زمینه ی داده کاوی است. هدف از خوشه بندی تفکیک داده ها است به گونه ای که داده های موجود در یک خوشه بیشترین شباهت را به یکدیگر و کمترین شباهت را با اعضای خوشه های دیگر داشته باشند. یکی از مهم ترینالگوریتم های خوشه بندی الگورریتم means-K می باشد. در این الگوریتم ابتدا به تعداد خوشه ها به صورت تصادفی از داده های اصلی مراکز خوشه اولیه انتخاب می شوند و سپس عمیات یافتن خوشه ها اجرا می شود. چالش اصلی در means-K انتخاب مراکز خوشه ها به صورت بهینه است. درگذشته پژوهش های متعددی در زمینه انتخاب مراکز اولیه خوشه ها در الگروریتم means-K صرورت گرفته است. در این مقاله برای نخستین بار روش جدیدی برای انتخاب مراکز خوشه ها مبتنی بر الگوکاوی ارائه می شود. در این روش ابتدا برای کاهش حجم داده ها، انتخاب ویژگی روی داده ها اعمال می شود؛ سپس الگوهای پرتکرار استخراج و برپایه ی این الگوها مراکزاولیه خوشه ها مشخص می شود. روش پیشنهادی با روش پایه means-K و با روش جدید BDD برر روی ۵ مجموعه داده با ابعاد گوناگون ارزیابی می شود. نتایج به دست آمده نشان می دهد در اغلب موارد، روش پیشنهادی عملکرد بهتری دارد

کلیدواژه ها:

خوشه بندی ، انتخاب ویژگی ، الگوکاوی ، مرکزخوشهK- means

نویسندگان

زهرا هاشمی

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر ، دانشگاه اراک ، اراک، ایران

مریم امیری

استادیار، گروه مهندسی کامپیوتر ، دانشگاه اراک ، اراک ، ایران