بررسی روش های موجود تطابق رکورد و بهبود بهره وری تشخیص تکرار

وحیده نمکی

بررسی روش های موجود تطابق رکورد و بهبود بهره وری تشخیص تکرار

محل انتشار: پنجمین کنفرانس ملی کاربرد فناوری های نوین در علوم مهندسی

سال انتشار: 1399

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 214

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1202827

شناسه ملی سند علمی:

ITCC05_097

تاریخ نمایه سازی: 22 اردیبهشت 1400

چکیده مقاله:

روش های متعددی برای تطبیق فیلدها و نحوه محاسبه میزان شباهت برای فیلدها مطرح است با توجه به این موضوع که پایگاه داده ها متشکل از رکوردها می باشند و این رکوردها به نوبه خود از فیلدهای متنوعی ساخته می شوند، بنابراین تشخیص تکرار در سطح رکورد کاری بس دشوار و پیچیده نسبت به سطح فیلد می باشد. در این مقاله هدفمان بررسی روش های مختلف برای تخمین میزان شباهت رکوردها در پایگاه داده ها می باشد. روش های ذکر شده بطور گسترده به دو دسته کلی تقسیم می شوند: روش هایی که مبتنی بر داده های آموزشی هستند تا "یاد بگیرند" که چگونه رکوردها را باهمتطبیق دهند، مدل های احتمالی و تکنیک های یادگیری ماشین در این قسمت قرار می گیرند و روش هایی که مبتنی بر دانش دامنه و یا معیارهای فاصله برای تطبیق رکوردها هستند. این قسمت شامل رویکردهایی است که از زبان های توصیفی برای تطبیق و همچنین روش هایی که از معیارهای فاصله،مناسب برای کار تشخیص تکرار استفاده می کنند. در این مقاله سعی خواهد شد روش ها را ارائه و با یکدیگر مقایسه گردد.

کلیدواژه ها:

تطبیق ، خوشه بندی ، SVM

نویسندگان

وحیده نمکی

کارشناسی ارشد نرم افزار دانشگاه آزاد اسلامی شبستر