خوشه بندی داده های هندسی نادقیق براساس مسئله k -مرکز

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 782

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NICC01_010

تاریخ نمایه سازی: 26 اسفند 1398

چکیده مقاله:

خوشه بندی یکی از رایج ترین ابزار در داده کاوی است که هدف از آن گروه بندی داده ها به خوشه هایی است که داده ها در خوشه های یکسان بیشترین شباهت و در خوشه های متفاوت کمترین شباهت را دارا هستند. در بسیاری از الگوریتم های خوشه بندی فرض بر آن است که داده ها بدون خطا و به صورت قطعی هستند در حالی که تعداد زیادی از داده ها در دنیای واقعی همراه با خطا بوده و الگوریتم های سنتی خوشه بندی برای این داده ها نا کارآمد هستند. از این رو ما در این مقاله به بررسی مسئله خوشه بندی داده ها تحت شرایط عدم قطعیت با استفاده از الگوریتم k -مرکز می پردازیم. ناحیه عدم قطعیتی که مورد بررسی قرار می دهیم به صورت مستطیل است. هدف، خوشه بندی این نقاط نادقیق به k خوشه مجزا است به طوریکه بیشترین فاصله مورد انتظار هر داده با مرکز خوشه مرتبط با خود کمینه گردد. در این مقاله به بررسی این مسئله در فضای دو بعدی می پردازیم و الگوریتم های تقریبی با فاکتور تقریب ۲ تحت متر منهتن و فاکتور تقریب ( )تحت متر اقلیدسی ارائه می دهیم.

نویسندگان

منصور داودی منفرد

دانشکده علوم رایانه و فناوری اطلاعات، دانشگاه تحصیلات تکمیلی علوم پایه زنجان

اسماعیل دلفراز پهلوانلو

دانشکده علوم رایانه و فناوری اطلاعات، دانشگاه تحصیلات تکمیلی علوم پایه زنجان

فاطمه عباسی

دانشکده علوم رایانه و فناوری اطلاعات، دانشگاه تحصیلات تکمیلی علوم پایه زنجان