روشی سریع برای کاوش قوانین انجمنی 1 در مجموعه داده های حجیم با استفاده از عملگر های منطقی
محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران
سال انتشار: 1385
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,641
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI12_026
تاریخ نمایه سازی: 23 دی 1386
چکیده مقاله:
با توجه به کاربرد روزافزون بانک های اطلاعاتی حجیم و انباره های بزرگ تراکن ش 2، اخیرا توجه بسیاری از محققان به سمت تولید روش های کارآمد جهت استخراج قوانین انجمنی معطوف گشته اس ت. اغلب روشها ی موجود در مرحله اول کار خود کلیه اقلام پرتکرار (ساده و ترکیب ی) را از بین تمام اقلام موجود در داده ها جستجو م یکنند که این امر نیازمند به خواندن مکرر کل داده ها از دیسک است . اکثر روشهایی هم که جدیدا پیشنهاد شده اند سعی بر این دارند تا لااقل میزان رخداد و درجه پشتیبان ی 3 بعضی از اقلام را بتوا ن مستقیما و بدون پیمایش داده ها محاسبه کر د. اما به این مساله کمتر توجه شده که چگونه به روش بهینه ای بر ای شمارش دفعات رخداد اقلام در مواقع ی ک ه راه ی جز شمارش وجود ندارد دست یابیم . در این مقاله راه حلی کارا برای این مساله ارائه شده است . در روش پیشنهادی ما ، داده ها تنها یک بار از دیسک خوانده می شوند و بعد از آن به یک ساختار رمز شده و خلاصه تبدیل می گردند، بطوریک ه اولا قابل نگهداری در حافظه می باشند و ثانیا با توجه به ساختار خاصی که دارند، عملیات شمارش به سریع ترین نحو ممکن انجام م یگردد و زمان شمارش دفعات تکرار اقلام در هر مرحله کمتر از مرحله قبل می شود . پس از ارائه الگوریتم، کارایی آن را با استفاده از دو مجموعه از داده های ساختگی و واقعی ارزیابی ک رده و با چند روش کارا که تاکنون ارائه شده اند، مقایسه میکنیم.
کلیدواژه ها:
نویسندگان
فخراحمد
عضو هیات علمی دانشگاه آزاد اسلامی واحد شیراز، بخش مهندسی کامپیوتر
صدرالدینی
استادیار دانشگاه شیراز، دانشکده مهندسی، بخش مهندسی و علوم کامپیوتر
ذوالقدری جهرمی
استادیار دانشگاه شیراز، دانشکده مهندسی، بخش مهندسی و علوم کامپیوتر
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :