CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

امتیاز دهی خودکار صفحات وب بوسیله الگوریتم های K-NN ، بیز ساده و بیز ساده چند کلاسه

عنوان مقاله: امتیاز دهی خودکار صفحات وب بوسیله الگوریتم های K-NN ، بیز ساده و بیز ساده چند کلاسه
شناسه ملی مقاله: IRCNFE01_020
منتشر شده در اولین کنفرانس بین المللی مهندسی برق و کامپیوتر در سال 1401
مشخصات نویسندگان مقاله:

علی اصغر صفایی - گروه مهندسی کامپیوتر ، دانشکده فنی مهندسی ، دانشگاه آزاد اسلامی ، قشم ، ایران
هدایت علیمرادی دوکوهی - گروه مهندسی کامپیوتر ، دانشکده فنی مهندسی ، دانشگاه آزاد اسلامی ، قشم ، ایران
سجاد احمدی - گروه مهندسی کامپیوتر ، دانشکده فنی مهندسی ، دانشگاه آزاد اسلامی ، قشم ، ایران

خلاصه مقاله:
امروزه صفحات گسترده وب به بزرگ ترین منبع اطلاعات برای انسان تبدیل شده است .با افزایش تعداد کاربران وب و همچنین وب سایت ها، نیاز به دسته بند صفحات وب روز به روز بیش تر احساس می شود. فقدان یک الگو و استاندارد جامع و دقیق در تنظیم متونی که بخش اعظم آنها بصورت غیر ساختیافته و نیمه ساخت یافته میباشند و حجمشان نیز به صورت مداوم افزایش می یابد کاملا محسوس می باشد و از طرفی نیز این کمبودباعث ایجاد آشفتگی و سردرگمی در جامعه اطلاعاتی می شود. اهمیت متن کاوی در مدیریت خدمات در حال افزایش است، زیرا دسترسی به داده های بزرگ در سراسر پلت فرم های دیجیتالی که چنین خدماتی را امکان پذیر می کند، افزایش می یابد. امتیاز دهی به محتوا میتواند در دسته بندی صفحات وب ماثر و در مدیریت اطلاعات و بازیابی اطلاعات نقش مهمی ایفا نماید. انتخاب ویژگی یک فرایند مهم برای امتیاز دهی و دسته بندی دقیق در صفحات وب می باشد. صفحات وب حاوی ویژگی های زیادی هستند که کارایی و دقت را کاهش می دهند لذا در این مقاله از الگوریتم های یادگیری ماشین K-NN ، بیز ساده و بیز ساده چند کلاسه استفاده می شود در نهایت از روش های انتخاب ویژگی برای انتخاب موثر ویژگی ها برای امتیاز دهی و دسته بندی صفحات وب استفاده خواهیم نمود.

کلمات کلیدی:
موتورهای جستجو ، صفحات وب، متن کاوی، دسته بندی صفحات، دسته بندی متون، یادگیری ماشین

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1534561/