CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

یک الگوریتم فازی برای یافتن الگوهای درختی پرتکرار

عنوان مقاله: یک الگوریتم فازی برای یافتن الگوهای درختی پرتکرار
شناسه ملی مقاله: ACCSI12_371
منتشر شده در دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1385
مشخصات نویسندگان مقاله:

مصطفی حقیرچهرقانی - گروه تحقیقاتی پایگاه داده، دانشکده برق و کامپوتر، دانشگاه تهران
مسعود رهگذر - قطب علمی کنترل و پردازش هوشمند، دانشکده برق و کامپوتر، دانشگاه تهران
کارو لوکس - قطب علمی کنترل و پردازش هوشمند، دانشکده برق و کامپوتر، دانشگاه تهران

خلاصه مقاله:
یکی از ابزارهای مهم برای مدل کردن داده ها و ارتباط بین آنها، درختها می باشن د و مهمترین مسئله در کاوش بانکهای اطلاعاتی درختی یافتن الگو های درختی پر تکر ار اس ت. الگوریتمهای موجود معمولا تعداد درختهایی که تولید می کنند بسیار زیاد است که تعدادی از آنها دارای ارزش زیادی نمی باشن د. این کم ارزش بودن اغلب به خاطر زیادی فاصله بین گره های الگو در درختهای ورودی می باشد که علاوه بر غیر قابل استفاده بودن الگو، موجب ک ند شدن الگوریتم نیز می شود. از طرف دیگر این الگوریتمها بعضی از درختهای مفید را پیدا نمی کنند. این امر در شرایطی اتفاق می افتد که الگوها به جای اینکه دقیقا همانند یکدیگر باشند در حجم بالایی از گره ها و ساختار درختی با یکدیگ رمشابهت داشته باشند. در مورد داده هایی که الگوهای دقیق آنها بسیار کم است این الگوهای تقریبی می توانند دید خوبی در مورد محتوای اطلاعات موجود در بانک اطلاعاتی درختی بدهن د. مشکل دیگر الگوریتمهای موجود، در برخورد با داده های عدد ی (صحیح و اعشار ی) مشاهده می گردد که مقایسه دقیق این نوع داده ها بهنگام استخراج الگو صحیح نمی باشد. در این مقاله سعی خواهیم کرد تا مشکلات مذکور را با استفاده از راه حل های فازی برطرف نمائیم

کلمات کلیدی:
داده های درختی، داده کاوی، الگوهای درختی پر تکرار، داده های XML ، نظریه فازی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/44757/