CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

انتخاب ویژگیها از صفحات وب مبتنی بر تئوری مجموعه ناهموار و اتوماتای یادگیر توزیع شده

عنوان مقاله: انتخاب ویژگیها از صفحات وب مبتنی بر تئوری مجموعه ناهموار و اتوماتای یادگیر توزیع شده
شناسه ملی مقاله: IDMC03_071
منتشر شده در سومین کنفرانس داده کاوی در سال 1388
مشخصات نویسندگان مقاله:

بابک نصیری - دانشکده برق کامپیوتر و فناوری اطلاعات دانشگاه آزاد اسلامی واحد قزوین
فریبرز محمودی - دانشکده برق کامپیوتر و فناوری اطلاعات
محمدرضا میبدی - دانشکده مهندسی کامپیوتر و فناوری اطلاعات

خلاصه مقاله:
صفحات وب حجم انبوهی از اطلاعات را در خود جای داده اند اما برای وب کاوی بسیاری از آنها زائد و اضافی می باشند از این رو لازم است بعنوان پیش پردازش ویژگیهای مناسب از بین این حجم اطلاعات استخراج شود از انجا که انتخاب ویژگیهای مناسب یک مسئله NP-hard بشمار می رود جستجو برای الگوریتم های تقریبی سریع و کارا همچنان ادامه دارد دراین مقاله یک روش ترکیبی جدید مبتنی بر تئوری مجموعه ناهموار و اتوماتای یادگیر توزیع شده برای انتخاب ویژگیهای مناسب در صفحات وب ارائه شده است نتایج حاصل از پیاده سازی روش پیشنهادی برروی چندین مجموعه داده از جمله یک مجموعه مبتنی بر وب حکایت از کارایی روش پیشنهادی درمقایسه با سایر روشهای شناخته شده دارد.

کلمات کلیدی:
انتخاب ویژگیها، وب کاوی، اتوماتای یادگیر توزیع شده، تئوری مجموعه ناهموار، محتوی کاوی وب

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/108943/