CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بررسی روش های موجود تطابق رکورد و بهبود بهره وری تشخیص تکرار

عنوان مقاله: بررسی روش های موجود تطابق رکورد و بهبود بهره وری تشخیص تکرار
شناسه ملی مقاله: ITCC05_097
منتشر شده در پنجمین کنفرانس ملی کاربرد فناوری های نوین در علوم مهندسی در سال 1399
مشخصات نویسندگان مقاله:

وحیده نمکی - کارشناسی ارشد نرم افزار دانشگاه آزاد اسلامی شبستر

خلاصه مقاله:
روش های متعددی برای تطبیق فیلدها و نحوه محاسبه میزان شباهت برای فیلدها مطرح است با توجه به این موضوع که پایگاه داده ها متشکل از رکوردها می باشند و این رکوردها به نوبه خود از فیلدهای متنوعی ساخته می شوند، بنابراین تشخیص تکرار در سطح رکورد کاری بس دشوار و پیچیده نسبت به سطح فیلد می باشد. در این مقاله هدفمان بررسی روش های مختلف برای تخمین میزان شباهت رکوردها در پایگاه داده ها می باشد. روش های ذکر شده بطور گسترده به دو دسته کلی تقسیم می شوند: روش هایی که مبتنی بر داده های آموزشی هستند تا "یاد بگیرند" که چگونه رکوردها را باهمتطبیق دهند، مدل های احتمالی و تکنیک های یادگیری ماشین در این قسمت قرار می گیرند و روش هایی که مبتنی بر دانش دامنه و یا معیارهای فاصله برای تطبیق رکوردها هستند. این قسمت شامل رویکردهایی است که از زبان های توصیفی برای تطبیق و همچنین روش هایی که از معیارهای فاصله،مناسب برای کار تشخیص تکرار استفاده می کنند. در این مقاله سعی خواهد شد روش ها را ارائه و با یکدیگر مقایسه گردد.

کلمات کلیدی:
تطبیق، خوشه بندی، SVM

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1202827/