CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بررسی فرایند تطبیق داده و تشخیصرکوردهای تکراری

عنوان مقاله: بررسی فرایند تطبیق داده و تشخیصرکوردهای تکراری
شناسه ملی مقاله: ICTI01_069
منتشر شده در اولین کنفرانس ملی فناوری های نوین در مهندسی برق و کامپیوتر در سال 1395
مشخصات نویسندگان مقاله:

صدیقه احمدی - دانشگاه آزاد اسلامی خرم آباد،ایران
حسن نادری - استادیار پایه ۴،دانشگاه علم و صنعت ایران

خلاصه مقاله:
پیوند رکورد، فرایند تطبیق رکوردهای چند پایگاه داده می باشد که به یک موجودیت اشاره دارند. در صورت استفاده از یک پایگاه داده، این فرایند را حذف تکرار گوییم. اهمیت داده های تطبیق داده شده، بطور فزاینده ای در بسیاری از حوزه های کاربردی، در حال افزایش می باشد، زیرا می توانند حاوی اطلاعاتی باشند که بدست آوردن آنها از راه های دیگر، بسیار هزینه بر است. حذف رکوردهای تکراری در یک پایگاه داده، گامی مهم در فرایند پاکیزه سازی داده ها بشمار می رود، زیرا تکرار می تواند اثر جدی بر نتایج هر گونه پردازش بعدی یا داده کاوی، داشته باشد. با افزایش اندازه پایگاه های داده امروزی، پیچیدگی فرایند تطبیق ،به یکی از چالشهای مهم برای پیوند رکورد و حذف تکرار، تبدیل شده است،به طوری که شناسایی و از بین بردن آن ها تاثیر بسزایی در سرعت پردازش و تحلیل اطلاعات داردکه روز به روز با افزایش حجم داده های موجود در جهان بر اهمیت آن افزوده می شود.

کلمات کلیدی:
تطبیق داده، پیوند داده، شاخصگذاری، کلید بلاک بندی، بردار مقایسه

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/622931/