مروری بر طبقه بندی و ابزارهای وب کاوی

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 122

فایل این مقاله در 16 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

STCONF06_201

تاریخ نمایه سازی: 7 شهریور 1402

چکیده مقاله:

وب جهانی منبع عظیمی از داده است که از محتوای وب، که توسط میلیاردها صفحه در دسترس عموم نمایش داده می شود، یا با استفاده از وب که توسط اطلاعات گزارشی که روزانه توسط همه سرورهای وب در اطراف جهان جمع آوری می شود، به دست می آید. از این رو، به دلیل رشد گسترده منابع اطلاعاتی موجود در وب جهانی ، نیاز روزافزونی برای کاربران وب به استفاده از ابزارهای خودکار برای یافتن اطلاعات مورد نظر وجود دارد. وب کاوی یکی از تکنیک های محبوب داده کاوی است که برای کشف و استخراج اطلاعات مفید از اسناد وب و خدمات آن استفاده می شود ، همچنین وب کاوی به عنوان یک رویکرد برجسته برای کشف رابطه بین اسناد وب عمل می کند. کاوش محتوای وب ، کاوش ساختار وب و کاوش محتوای وب ، سه دسته مختلف از کاوی وب هستند. هر یک از این دسته ها الگوریتم ها ، ابزارها و رویکردهای مختلفی برای استخراج دادهها از حجم اطلاعات روی وب دارند . در این مقاله مروری بر نمای کلی و طبقه بندی وب کاوی و مطالعه تطبیقی تکنیک های اخیر وب کاوی ارائه می گردد. همچنین انواع وب کاوی و ابزارهای مورد استفاده در فرآیند وب کاوی نیز مورد بررسی قرار گرفته است

کلیدواژه ها:

نویسندگان

حجت آزادروش

دانشجوی کارشناسی ارشد مهندسی کامپیوتر ، واحد مشهد ، دانشگاه آزاد اسلامی ، مشهد ، ایرا ن

رضا شیبانی

گروه مهندسی کامپیوتر ، واحد مشهد ، دانشگاه آزاد اسلامی ، مشهد ، ایرا ن