بهبود پیچیدگی زمانی الگوریتم DBSCAN با تلفیق شبکه های توری

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 803

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ETECH04_067

تاریخ نمایه سازی: 27 بهمن 1398

چکیده مقاله:

خوشه بندی یکی از مسائل مهم در پردازش داده ها و داده- کاوی است که هدف اصلی آن پیدا کردن نمونه های مشابه در داده ها است. الگوریتم های خوشه بندی متنوعی وجود دارد. تفاوت الگوریتم ها در رویکرد خوشه بندی و مقیاس شباهتی است که استفاده می کنند. در میان این الگوریتم ها DBSCAN یکی از محبوبترین الگوریتم های چگالی محور است. این روش قادر است که نمونه های آموزشی را با شکل های مختلف شناسایی کند و به همین دلیل کاربردهای بسیار زیادی دارد. اگرچه این الگوریتم، مزایای خاص خود را دارد، اما دو نقطه ضعف مهم دارد. اول اینکه برای پایگاه داده های بسیار بزرگ کارایی مناسبی ندارد، دوم آنکه تعیین کردن پارامترهای eps و MinPts برای به دست آوردن خوشه بندی بهینه کار سختی است. برای حل این مشکلات، در این مقاله یک نوع دیگر از الگوریتم DBSCAN به نام GM2-DBSCAN ارائه شده است که از شبکه بندی و پارامترهای محلی برای حل مشکلات مذکور بهره می برد. با آزمایش الگوریتم جدید روی چندین مجموعه داده مختلف نشان داده شده است که الگوریتم از کارایی بالایی در تشخیص خوشه ها برخوردار بوده و همزمان پیچیدگی زمانی آن نسبت به الگوریتم DBSCAN کمتر است.

کلیدواژه ها:

داده کاوی ، خوشه بندی ، DBSCAN ، خوشه بندی شبکه محور ، خوشه بندی چگالی محور

نویسندگان

علی کمندی

دانشکده علوم مهندسی، پردیس فنی دانشگاه تهران تهران، ایران

نگار اوحدی

دانشکده علوم مهندسی، پردیس فنی دانشگاه تهران تهران، ایران

محمود شعبان خواه

دانشکده علوم مهندسی، پردیس فنی دانشگاه تهران تهران، ایران

سید محسن فاطمی

دانشکده علوم مهندسی، پردیس فنی دانشگاه تهران تهران، ایران

سید محسن حسینی

دانشکده علوم مهندسی، پردیس فنی دانشگاه تهران تهران، ایران