کاوش قوانین انجمنی در اسناد XML با روش شاخص جدولی بهینه شده
عنوان مقاله: کاوش قوانین انجمنی در اسناد XML با روش شاخص جدولی بهینه شده
شناسه ملی مقاله: IDMC02_070
منتشر شده در دومین کنفرانس داده کاوی ایران در سال 1387
شناسه ملی مقاله: IDMC02_070
منتشر شده در دومین کنفرانس داده کاوی ایران در سال 1387
مشخصات نویسندگان مقاله:
علیرضا زارع فرخادی
امیر اسمعیل زاده
افشین مهرابی
فریبرز محمودی
خلاصه مقاله:
علیرضا زارع فرخادی
امیر اسمعیل زاده
افشین مهرابی
فریبرز محمودی
استفاده از اسناد XML، بعنوان یک استاندارد جهانی، در پایگاه داده ها روز به روز در حال افزایش است. از اینرو روابط موجود بین داده های XML بعنوان یک چالش عمده مطرح و نیاز به استخراج دانش از داده های خام جهت افزایش هوش سازمانی کاملا محسوس است. روش شاخص جدولی بعنوان یک روش در این راستا مطرح است. در این مقاله راهکاری جهت بهبود این روش ارائه شده است که هم از نظر فرآیند کاوش و هم از نظر زمان استخراج اطلاعات، روش نامر برده را بهبود بخشیده است. روش شاخص جدولی قوانین رااز محتویات XML بدون اطلاع از روابط مورد نظر کاربر استخراج کرده و به کاوش قوانین ناشناخته، بروی اسناد با ساختارهای مشابه می پردازد. در حالیکه در روش ارائه شده در این مقاله بدون اینکه اطلاعی از ساختار اسناد در دسترس باشد می توان به کشف قوانین ناشناخته پرداخت، برای این منظور در ابتدا داده های خام را از اسناد XML استخراج و براساس ساختار درختی آن، جدول رابطه ای مشتمل بر تراکنشها و آیتمها لیست شده و سپس به روش کاوش قوانین انجمنی، قوانین معتبر بدست آمده و دانش مورد نیاز آن روی آن قوانینی بدست می آید.
کلمات کلیدی: پایگاه داده XML، داده کاوی، کاوش قوانین انجمنی
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/70460/