داده کاوی در داده های عظیم: یافتن نزدیک ترین همسایه به کمک درهمسازی میانی

مهدی, محمدیان

داده کاوی در داده های عظیم: یافتن نزدیک ترین همسایه به کمک درهمسازی میانی

عنوان مقاله: داده کاوی در داده های عظیم: یافتن نزدیک ترین همسایه به کمک درهمسازی میانی
شناسه ملی مقاله: EMAA16_029
منتشر شده در شانزدهمین همایش ملی پژوهش های نوین در علوم و فناوری در سال 1397

مشخصات نویسندگان مقاله:

مهدی محمدیان - مربی، دانشکده مهندسی کامپیوتر، دانشگاه پیام نور تهران ایران / دانشجوی مقطع دکتری، گرایش نرم افزار، دانشگاه علم و صنعت، تهران

خلاصه مقاله:

یکی از مسائل اساسی در داده کاوی داده های عظیم، یافتن نزدیک ترین همسایه به یک بردار مورد پرسوجوست. حجم انبوهی از داده ها که ممکن است ابعاد بالائ ی نیز داشته باشند، با استفاده از یک معیار فاصله یا شباهت جهت یافتن نزدیک ترین همسایه کنکاش می شوند. وجود این حجم عظیم از داده ها بر روی حافظه های مانا و پرهزینه بودن عملیا ت های ورودی/خروجی جهت یافتن نزدیک ترین همسایه، سبب شده است تا مسئله یافتن نزدیک ترین همسایه از نظر زمان و فضا بسیار پرهزینه باشد. تحقیقات گسترده ای که پیرامون این مسئله صورت گرفته است منجر به هور الگوریتم های شده است که قادرند با استفاده از توابع درهمساز، نزدیک ترین همسایه تقریبی یک پرس و جو را که تقریب آن قابل قبول باشد، به عنوان خروجی برگردانند. به این دسته از توابع، توابع درهمساز میانی گفته می شود. این الگوریتم ها توانسته اند از نظر دقت، فضا و زمان، عملکرد مناسبی را از خود نشان دهند. در این مقایسه قصد داریم تا به صورت کلی به معرفی این دسته از الگوریتم ها بپردازیم

کلمات کلیدی:

داده کاوی، داده های عظیم، نزدیک ترین همسایه، درهمسازی، درهمسازی میانی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/932732/