بررسی روش های موجود تطابق رکورد و بهبود بهره وری تشخیص تکرار

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 214

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ITCC05_097

تاریخ نمایه سازی: 22 اردیبهشت 1400

چکیده مقاله:

روش های متعددی برای تطبیق فیلدها و نحوه محاسبه میزان شباهت برای فیلدها مطرح است با توجه به این موضوع که پایگاه داده ها متشکل از رکوردها می باشند و این رکوردها به نوبه خود از فیلدهای متنوعی ساخته می شوند، بنابراین تشخیص تکرار در سطح رکورد کاری بس دشوار و پیچیده نسبت به سطح فیلد می باشد. در این مقاله هدفمان بررسی روش های مختلف برای تخمین میزان شباهت رکوردها در پایگاه داده ها می باشد. روش های ذکر شده بطور گسترده به دو دسته کلی تقسیم می شوند: روش هایی که مبتنی بر داده های آموزشی هستند تا "یاد بگیرند" که چگونه رکوردها را باهمتطبیق دهند، مدل های احتمالی و تکنیک های یادگیری ماشین در این قسمت قرار می گیرند و روش هایی که مبتنی بر دانش دامنه و یا معیارهای فاصله برای تطبیق رکوردها هستند. این قسمت شامل رویکردهایی است که از زبان های توصیفی برای تطبیق و همچنین روش هایی که از معیارهای فاصله،مناسب برای کار تشخیص تکرار استفاده می کنند. در این مقاله سعی خواهد شد روش ها را ارائه و با یکدیگر مقایسه گردد.

کلیدواژه ها:

نویسندگان

وحیده نمکی

کارشناسی ارشد نرم افزار دانشگاه آزاد اسلامی شبستر