توسعه یک الگوریتم خوشه بندی با ناظر افزایشی برای داده های جریانی
محل انتشار: کنفرانس ملی سیستم های هوشمند و محاسبات سریع
سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 484
فایل این مقاله در 21 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ECECON01_019
تاریخ نمایه سازی: 25 بهمن 1399
چکیده مقاله:
امروزه با توجه به حجم زیاد و سرعت بالای داده های جریانی در حال تولید، نیاز به ذخیره و مدیریت این داده ها بیشتر احساس می شود. خوشه بندی داده های جریانی به دلیل ماهیت غیر ثابت و نامحدود آن ها، با چالش های بسیاری مواجه است. داده های جریانی دارای ترتیب زمانی، تغییرات سریع، حجم عظیم و به طور بالقوه از داده های بی نهایت تشکیل دادند. الگوریتم های زیادی در زمینه خوشه بندی داده های جریانی ارائه شده است. با این حال الگوریتم های بسیار محدودی در زمینه داده های جریانی با ناظر ارائه شده است. در این مقاله، یک الگوریتم دو مرحله ای خوشه بندی پویای داده های جریانی DCDS که یک روش با ناظر افزایشی است، توسعه داده شده است. در این الگوریتم، داده های جریانی به صورت اتوماتیک و بدون نیاز به دریافت هیچ پارامتری از کاربر، خوشه بندی می شوند. علاوه بر این، از خوشه های تولید شده، جهت کلاس بندی داده های بدون برچسب می توان استفاده کرد. نتایج تجربی روش پیشنهادی بر روی شش مجموعه داده از UCI نشان می دهد که روش ارائه شده نسبت به روش های موجود با توجه به معیارهای ارائه شده دارای برتری می باشد.
کلیدواژه ها:
نویسندگان
شاهرخ اسدی
استادیار، آزمایشگاه داده کاوی، دانشکده مهندسی پردیس فارابی دانشگاه تهران
سهیلا نیک پور
دانشکده فنی مهندسی، دانشگاه ازاد اسلامی واحد تهران شمال