پیمایش موضوعی وب با استفاده از اتوماتای یادگیر توزیع شده و پارتیشن بندی گراف

سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 972

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICS11_167

تاریخ نمایه سازی: 14 مهر 1392

چکیده مقاله:

پیمایش وب جهت یافتنی صفحاتی که توسط موتور جستجو شاخص گذاری شوند، از اهمیت بالایی برخوردار است. از آن جا که حجم صفحات وب بسیار بالا و همواره رو به افزایش است، موتورهای جستجو قادر به شاخص گذاری صفحات محدودی هستند. پیمایشگرهای موضوعی با پیمایشگرهای متمرکز، در روند پیمایش خود به صورت انتخاب گر عمل می کنند و صفحاتی را برای پیمایش انتخاب می کنند که تا حد ممکن در ارتباط با موضوعی خاص باشند. در این مقاله روشی ترکیبی مبتنی بر اتوماتای یادگیر توزیع شده و پارتیشن بندی گراف برای پیمایش موضوعی صفحات وب پیشنهاد می گردد. روش پیشنهادی با استفاده از الگوریتم HITSو ساختار پیوند بین صفحات که از طریق رفتار کاربر در مشاهده این صفحات به دست آمده است، صفحاتی را برای پیمایش انتخاب می کند. در این مقاله از پارتیشن بندی گراف وب برای بهبود کارایی استفاده شده است. به منظور ارزیابی، نتایج روش پیشنهادی با نتایج الگوریتم عرض اول، Best Firstو الگوریتمی دیگری مبتنی بر اتوماتای یادگیر توزیع شده مقایسه شده است. نتایج آزمایش ها حاکی از کارایی روش پیشنهادی دارد

کلیدواژه ها:

پیمایش موضوعی وب ، اتوماتای یادگیر توزیع شده ، پارتیشن بندی گراف ، داده های استفاده از وب ، الگوریتم HITS

نویسندگان

مجید تاران

شرکت خدمات انفورماتیک، تهران، ابران

شهرزاد معتمدی مهر

دانشکده فنی و مهندسی، دانشگاه خوارزمی، تهران، ایران

علی برادران هاشمی

دانشکده مهندسی کامپیوتر و فناوری اطلاعات،دانشگاه صنعتی امیرکبیر، تهران، ایران

محمد رضا میبدی

دانشکده مهندسی کامپیوتر و فناوری اطلاعات،دانشگاه صنعتی امیرکبیر، تهران، ایران