CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بهبود کیفیت خوشه بندی صفحات وب به روش K-means با استفاده از کاهش ابعاد فضا و تفسیر جایگاه مکانی لغات

عنوان مقاله: بهبود کیفیت خوشه بندی صفحات وب به روش K-means با استفاده از کاهش ابعاد فضا و تفسیر جایگاه مکانی لغات
شناسه ملی مقاله: CONECE02_003
منتشر شده در دومین همایش ملی ایده های نوین در مهندسی برق و کامپیوتر در سال 1396
مشخصات نویسندگان مقاله:

آرش پیک - گروه کامپیوتر دانشگاه بین المللی امام رضا ع مشهد
عادل قاضی خانی - عضو هییت علمی گروه کامپیوتر دانشگاه بین المللی امام رضا ع مشهد

خلاصه مقاله:
از آنجایی که صفحات وب و اسناد متنی موجود در وب معمولا به صورت خوشه بندی نشده و خام هستند جهت بازیابی اطلاعات بهبود نتایج موتور های جست و جو خلاصه سازی متون عملیات های خزشی وب و سایر حوزه ها اسناد موجود در وب را خوشه بندی میکنیم در این روش پیشنهادی ضمن شمارش تعداد هر لغت درون صفحه وب و تشکیل یک بردار به ازای هر صفحه وب جهت افزایش کیفیت خوشه بندی از جایگاه مکانی لغات درون صفحه وب کمک میگیریم بدین ترتیب ارزش هر کلمه در هر جایگاه مکانی از متن صفحه وب با ارزش کلمه ای دیگر در جایگاهی دیگر متفاوت است هم چنین جهت بهبود کیفیت و کاهش طمان خوشه بندی لغات اضافی متن را تشخیص و از روند خوشه بندی حذف میکنیم در ارزیابی روش پیشنهادی در مقایسه با روش k-means فازی با تابع آنتروپی افراز بهبود قابل توجهی را داشته ایم

کلمات کلیدی:
خوشه بندی- صفحات وب- اسناد متنی-k-means- ارزش مکانی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/662624/