ارائه روش تطابق وزن دار برای تطبیق فیلدها و رکودها در پایگاه داده ها

سال انتشار: 1389
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,324

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSICC16_126

تاریخ نمایه سازی: 28 بهمن 1390

چکیده مقاله:

نحوههای مختلف ورود اطلاعات باعث بهوجودآمدن رکوردهای تکراری میشود که این امر باعث افزایش حجم پایگاهدادهها میگردد.در این مقاله، روشی به نام تطابق وزندار پیشنهاد شدهاست تا تطابق بین فیلدها و رکوردها معقولتر انجام شود. برخی از روشهای موجود روی کلمات یک بخشی به خوبی عمل میکنند ولی کاربرد خوبی در کلمات چندبخشی ندارند ولی روش تطابق وزندار کارایی خوبی برای کلمات چندبخشی دارد و درجه شباهت بالایی را برای اینگونه فیلدها دارا است و از آنجایی که بیشتر عد م تشابه ها وابسته به خطاهایی است که بر اثر ورود اشتباهی حروف مشابه بهوجود آمدهاست، این روش با درنظر گرفتن شباهتی برای حروف مشابه، دقت را در خطاهای تایپی بالا میبرد. همچنین این روش حساسیتی نسبت به کاراکترهای شبیه به هم دارد . از آنجایی که مقادیر نامعتبر فیلدها تاثیر زیادی روی تطابق رکوردها دارد، این روش اثرات این نوع فیلدها را کمتر در نظر میگیرد تا دقت معقول- تری بهدست بیاید. بعداز بیان و بررسی روش تطابق وزندار، آزمایشهایی با این روش و روشهای موجود روی دو پایگا ه داده واقعی انجام شد و نتایج آن مورد مقایسه و بررسی قرار گرفت که این روش بر روی پایگاهدادهها دقتی درحدود ۹۰ درصد داشت که مابین ۶ تا ۸ درصد نسبت به بهترین حالت بهبود نشان میدهد

نویسندگان

محمدرضا فیضی درخشی

گروه کامپیوتر دانشگاه تبریز

آزاده روحانی

دانشگاه آزاد اسلامی واحد شبستر،گروه کامپیوتر،شبستر،ایران

مهسا صباغ نوبریان

دانشگاه آزاد اسلامی واحد شبستر،گروه کامپیوتر،شبستر،ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف _ تهران _ 17 ...
  • K. Elmagarmid., P. G. Ipeirotis., V. S. Verykios, "Duplicate record ...
  • Alvaro E. Monge., Charles P.. Elkan., "The Field Matching Problem: ...
  • Federico Maggi, "A Survey of Probabilistic Record atchingModels, Techniques and ...
  • V.I. Levenshtein, "Binary Codes Capable of Correcting Deletions, Insertions and ...
  • G.M. Landau and U. Vishkin, "Fast Paralle and Serial Approximate ...
  • Jaro, M. A "Probabilistic linkage of large public health data ...
  • Winkler, W. E, "The state of record linkage and current ...
  • Winkler, W. E, "Overview of Record Linkage and Current Research ...
  • Andreas FFurer , "Combining Runtime and Static Universe Type Inference ...
  • نمایش کامل مراجع