CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

کاوش قوانین انجمنی در اسناد XML با روش شاخص جدولی بهینه شده

عنوان مقاله: کاوش قوانین انجمنی در اسناد XML با روش شاخص جدولی بهینه شده
شناسه ملی مقاله: IDMC02_070
منتشر شده در دومین کنفرانس داده کاوی ایران در سال 1387
مشخصات نویسندگان مقاله:

علیرضا زارع فرخادی
امیر اسمعیل زاده
افشین مهرابی
فریبرز محمودی

خلاصه مقاله:
استفاده از اسناد XML، بعنوان یک استاندارد جهانی، در پایگاه داده ها روز به روز در حال افزایش است. از اینرو روابط موجود بین داده های XML بعنوان یک چالش عمده مطرح و نیاز به استخراج دانش از داده های خام جهت افزایش هوش سازمانی کاملا محسوس است. روش شاخص جدولی بعنوان یک روش در این راستا مطرح است. در این مقاله راهکاری جهت بهبود این روش ارائه شده است که هم از نظر فرآیند کاوش و هم از نظر زمان استخراج اطلاعات، روش نامر برده را بهبود بخشیده است. روش شاخص جدولی قوانین رااز محتویات XML بدون اطلاع از روابط مورد نظر کاربر استخراج کرده و به کاوش قوانین ناشناخته، بروی اسناد با ساختارهای مشابه می پردازد. در حالیکه در روش ارائه شده در این مقاله بدون اینکه اطلاعی از ساختار اسناد در دسترس باشد می توان به کشف قوانین ناشناخته پرداخت، برای این منظور در ابتدا داده های خام را از اسناد XML استخراج و براساس ساختار درختی آن، جدول رابطه ای مشتمل بر تراکنشها و آیتمها لیست شده و سپس به روش کاوش قوانین انجمنی، قوانین معتبر بدست آمده و دانش مورد نیاز آن روی آن قوانینی بدست می آید.

کلمات کلیدی:
پایگاه داده XML، داده کاوی، کاوش قوانین انجمنی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/70460/