شناسایی رانش مفهوم در جریان داده و افراز فضای داده به مفاهیم مجزا

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 30

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CDI20_015

تاریخ نمایه سازی: 18 فروردین 1403

چکیده مقاله:

بخش عظیمی از دنیای تکنولوژی امروز را سیستم های اطلاعاتی تشکیل داده اند که با جریانی پیوسته و سریع از داده کار می-کنند(جریان داده). رانش مفهوم یا تغییر توزیع داده در گذر زمان پدیده ای ذاتی در جریان داده است و اصلی ترین دلیل کاهش اثر بخشی سیستم های مبتنی بر استخراج اطلاعات از داده شناخته شده است. در این مقاله با استفاده از یک روش شناسایی رانش مفهوم ابتکاری و مبتنی بر gTest که اساس آن شمارش تکرار ویژگی های موثر در دسته بندی نمونه ها است، بر روی سه پایگاه دادگان واقعی رانش مفهوم را شناسایی کرده و براساس آن فضای داده به مفاهیم کوچکتر و مجزا تقسیم می شود. سپس با ایجاد مدل دسته بندی انحصاری برای هر مفهوم و افزایش تعداد مدل یادگیری در فضای داده، قادر خواهیم بود دقت پیش بینی و دسته بندی در یادگیری ماشین را بهبود ببخشیم.

کلیدواژه ها:

نویسندگان

امیر کتول

کارشناسی ارشد، دانشگاه گلستان دانشکده فنی مهندسی گرگان، گروه مهندسی کامپیوتر

مهدی یعقوبی

استادیار، دانشگاه گلستان، دانشکده فنی مهندسی گرگان، گروه مهندسی کامپیوتر