ارائه روش جدید برای پیش بینی موضوع صفحات وب در خزشگرهای کانونی

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,583

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSITM01_424

تاریخ نمایه سازی: 10 شهریور 1393

چکیده مقاله:

اینترنت، در سالهای اخیر روند سریع و روبه رشدی را طی میکند و تعداد صفحات وب نیز به طور روز افزون در حال افزایش استو این رشد نمایی، دستیابی به اطلاعات مرتبط را روز بهروز مشکل تر نموده است. در طی این سالها همواره مسئله کلیدی درطراحی خزشگرهای کانونی، چگونگی تعیین ارتباط پیوندهای بازدید نشده با موضوع جستجو بوده است. پیش بینی موثر موضوعصفحه وب، از دانلود و مشاهده صفحات غیر مرتبط ممانعت می کند. در این مقاله، یک روش جدید مبتنی بر یادگیری برای بهبود پیش بینی موضوع پیوندها در خزشگرهای کانونی، پیشنهاد شده است. برای این مطالعه، از ابزار دسته بندی بیز ساده و CRT برای دسته بندی و پیش بینی موضوع استفاده شده است. نتایج این تحقیق نشان داد که رویکرد ما در انتخاب چهار ویژگی کلمات پیوند، لنگر، عنوان و متن صفحه پدر کارایی بهتری دارد؛ همچنین عنوان صفحه پدر ویژگی مهمی در پیش بینی موضوع پیوند است که با ویژگی های کلمات پیوند و لنگر و عنوان صفحه پدر و متن صفحه پدر با ابزار دسته بندی CRT، دقت 0.894 و فراخوانی 0.894 حاصل شده است.

نویسندگان

رامین دلیر

دانشجوی کارشناسی ارشد دانشگاه جامع امام حسین(ع)

محمدرضا حسنی آهنگر

استادیار گروه کامپیوتر دانشگاه جامع امام حسین (ع)

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • نعمت زاده. آ. مطیعی. س. و شمش فرد. م. (1384). ...
  • Gulli, A., & Signorini, A. (2005). The indexable we) is ...
  • Hati, D., & Kumar, A. (2010). An approach for identifying ...
  • Hersovici, M., Jacovi, M., Maarek, Y. S., Pelleg, _ Shtalhaim, ...
  • Menczer, F, Pant, G., & Srinivasan, P. (2004). Topical web ...
  • Pal, A., Tomar, D. S., & Shrivastava, S. (2009). Effective ...
  • Safran, M. S., Althagafi, A, & Che, D. (2012). Improving ...
  • Taylan, D., Poyraz, M., Akyokus, S., & Ganiz, M. C. ...
  • Zhang, Y., Yin, C., & Yuan, F. (2007). An application ...
  • نمایش کامل مراجع