CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مروری بر طبقه بندی و ابزارهای وب کاوی

عنوان مقاله: مروری بر طبقه بندی و ابزارهای وب کاوی
شناسه ملی مقاله: STCONF06_201
منتشر شده در ششمین همایش ملی فناوریهای نوین در مهندسی برق، کامپیوتر و مکانیک ایران در سال 1402
مشخصات نویسندگان مقاله:

حجت آزادروش - دانشجوی کارشناسی ارشد مهندسی کامپیوتر ، واحد مشهد ، دانشگاه آزاد اسلامی ، مشهد ، ایرا ن
رضا شیبانی - گروه مهندسی کامپیوتر ، واحد مشهد ، دانشگاه آزاد اسلامی ، مشهد ، ایرا ن

خلاصه مقاله:
وب جهانی منبع عظیمی از داده است که از محتوای وب، که توسط میلیاردها صفحه در دسترس عموم نمایش داده می شود، یا با استفاده از وب که توسط اطلاعات گزارشی که روزانه توسط همه سرورهای وب در اطراف جهان جمع آوری می شود، به دست می آید. از این رو، به دلیل رشد گسترده منابع اطلاعاتی موجود در وب جهانی ، نیاز روزافزونی برای کاربران وب به استفاده از ابزارهای خودکار برای یافتن اطلاعات مورد نظر وجود دارد. وب کاوی یکی از تکنیک های محبوب داده کاوی است که برای کشف و استخراج اطلاعات مفید از اسناد وب و خدمات آن استفاده می شود ، همچنین وب کاوی به عنوان یک رویکرد برجسته برای کشف رابطه بین اسناد وب عمل می کند. کاوش محتوای وب ، کاوش ساختار وب و کاوش محتوای وب ، سه دسته مختلف از کاوی وب هستند. هر یک از این دسته ها الگوریتم ها ، ابزارها و رویکردهای مختلفی برای استخراج دادهها از حجم اطلاعات روی وب دارند . در این مقاله مروری بر نمای کلی و طبقه بندی وب کاوی و مطالعه تطبیقی تکنیک های اخیر وب کاوی ارائه می گردد. همچنین انواع وب کاوی و ابزارهای مورد استفاده در فرآیند وب کاوی نیز مورد بررسی قرار گرفته است

کلمات کلیدی:
وب کاوی ، کاوش محتوای وب ، کاوش ساختار وب ، کاوش استفاده از وب

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1744263/