CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه یک چارچوب خزش زبانی جهت بهبود خزش مستندات زبانی

عنوان مقاله: ارائه یک چارچوب خزش زبانی جهت بهبود خزش مستندات زبانی
شناسه ملی مقاله: IDMC03_022
منتشر شده در سومین کنفرانس داده کاوی در سال 1388
مشخصات نویسندگان مقاله:

معصومه عظیم زاده - پژوهشگر کارشناسی ارشد مرکز تحقیقات مخابرات ایران
علیرضا یاری - هیئت علمی دکترا مرکز تحقیقات مخابرات انتهای کارگر شمالی

خلاصه مقاله:
روشهای خزش زبانی مبتنی بر ایده خزش متمرکز ارائه گردیده اند که عامل تمرکز آنها صفحات وب متعلق به یک زبان است باتوجه به اینکه در رابطه با خزش زبانی تحقیق زیادی صورت نگرفته و چارچوب جامعی ارائه نشده دراین مقاله براساس شاخصهای خزش زبانی چارچوبی جهت خزش زبانی وب خصوصا خزش وب فارسی ارائه گردیده است در راستای ارزیابی چارچوب پیشنهادی روشی مبتنی بر ترکیب مناسبی از شاخصهای ارائه شده در چارچوب پیشنهاد شده و ارزیابی گردیده است نتایج ارزیابی روش خزش زبانی ارائه شده نشان میدهد که ترکیب شاخصهای منتخب و مکانیزم وزندهی مناسب بهبود قابل توجهی در حجم مستندات فارسی جمع اوری شده و سرعت جمع اوری آنها پدید می اورد.

کلمات کلیدی:
خزشگر، خزش زبانی ، وب، بازیابی اطلاعات، وب فارسی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/108894/