توسعه یک الگوریتم خوشه بندی با ناظر افزایشی برای داده های جریانی

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 484

فایل این مقاله در 21 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ECECON01_019

تاریخ نمایه سازی: 25 بهمن 1399

چکیده مقاله:

امروزه با توجه به حجم زیاد و سرعت بالای داده های جریانی در حال تولید، نیاز به ذخیره و مدیریت این داده ها بیشتر احساس می شود. خوشه بندی داده های جریانی به دلیل ماهیت غیر ثابت و نامحدود آن ها، با چالش های بسیاری مواجه است. داده های جریانی دارای ترتیب زمانی، تغییرات سریع، حجم عظیم و به طور بالقوه از داده های بی نهایت تشکیل دادند. الگوریتم های زیادی در زمینه خوشه بندی داده های جریانی ارائه شده است. با این حال الگوریتم های بسیار محدودی در زمینه داده های جریانی با ناظر ارائه شده است. در این مقاله، یک الگوریتم دو مرحله ای خوشه بندی پویای داده های جریانی DCDS که یک روش با ناظر افزایشی است، توسعه داده شده است. در این الگوریتم، داده های جریانی به صورت اتوماتیک و بدون نیاز به دریافت هیچ پارامتری از کاربر، خوشه بندی می شوند. علاوه بر این، از خوشه های تولید شده، جهت کلاس بندی داده های بدون برچسب می توان استفاده کرد. نتایج تجربی روش پیشنهادی بر روی شش مجموعه داده از UCI نشان می دهد که روش ارائه شده نسبت به روش های موجود با توجه به معیارهای ارائه شده دارای برتری می باشد.

کلیدواژه ها:

خوشه بندی با ناظر ، داده های جریانی ، یادگیری افزایشی ، کلاس بندی ، خوشه بندی سلسله مراتبی

نویسندگان

شاهرخ اسدی

استادیار، آزمایشگاه داده کاوی، دانشکده مهندسی پردیس فارابی دانشگاه تهران

سهیلا نیک پور

دانشکده فنی مهندسی، دانشگاه ازاد اسلامی واحد تهران شمال