فیلترینگ صفحات وب با استفاده از تجزیه محتوا و ساختار

سال انتشار: 1390
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,557

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCCIT01_007

تاریخ نمایه سازی: 17 اردیبهشت 1391

چکیده مقاله:

با رشد توسعه وب جستجوی مطالب مرتبط با نیازها با استفاده ازموتورهای جستجوی سنتی مشکل تر می شود ما یک دیدگاه آموزش ماشین محور را پیشنهاد می کنیم که تجزیه محتوا و ساخترا وب را با یکدیگر ترکیب می کند هرصفحه وب را بوسیله مجموعه ای از ویژگیهای محتوا - محور و لینک محور نمایش می دهیم که به عنوان ورودی برای الگوریت م های یادگیری ماشین مختلف بکارمیرود دیدگاه پیشنهادی با استفاده از یک شبکه عصبی بازخورد / پس انتشار و یک ماشین بردار پشتیبان طراحی شده تا این دیدگاه را با دو روش موجود در فیلترینگ صفحه وب یعنی دیدگاه کلمه کلیدی - محور و واژه محور مقایسه نماید نتایج آزمایش نشان داد کهدیدگاه پیشنهادی در حالت کلی به ویژه زمانی که تعداد اسناد آموزشی کم باشد بهتر عمل می کند دیدگاه پیشنهادی را می توان درتوسعه موتورهای جستجوی مخصوص موضوع و سایر کاربردهای وب نظیر مدیریت محتوای وب بکاربرد.

کلیدواژه ها:

دسته بندی صفحات وب ، تجزیه لینک ، یادگیری ماشین ، وبکاوی

نویسندگان

نسرین احمدی

کارشناسی ارشد مهندسی نرم افزار کامپیوتر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Chau, M., Chen, H., "Comparison of three vertical search spiders ...
  • Chau M., Chen H., "Incorporating Web analysis into neural networks: ...
  • Sun, A., Lim, E., "Performance measuremet framework for hierarchical text ...
  • Lin, S. H., Chen, M. C., Ho, J. M., Huang, ...
  • Oh, H. J., Myaeng, S. H., Lee, M. H., "A ...
  • Yang, Y.. Slattery, S., Ghani, R., "A study of approaches ...
  • نمایش کامل مراجع