CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بازیابی اطلاعات از ویکی پدیا بر اساس علم آمار

عنوان مقاله: بازیابی اطلاعات از ویکی پدیا بر اساس علم آمار
شناسه ملی مقاله: NCAEE02_036
منتشر شده در دومین همایش ملی پژوهش های کاربردی در مهندسی برق وکامپیوتر در سال 1395
مشخصات نویسندگان مقاله:

مژگان رستگار - دانشجوی کارشناسی ارشد، دانشگاه پویش قم ، گروه مهندسی کامپیوتر، قم، ایران

خلاصه مقاله:
برای تجزیه و تحلیل متون از متن کاوی استفاده می شود. متن کاوی شامل قوانینی آماری برای استخراج ویژگی های آماری متون است. اگرمتن کاوی بر روی متون درهم ریخته اینترنت انجام شود، بدلیل بی ساختار بودن متون، امکان وجود خطا در تحلیل های متنی وجود دارد.یکی از منابع دانشی مناسب برای استخراج متن، مجموعه ویکی پدیا است. ویکی پدیا بدلیل ساختارمند بودن و استفاده از لغات ساده، دارایویژگی های ارزشمند دانشی است. در این مقاله ویکی پدیا را از دیگاه هستی شناسی بررسی می کنیم.

کلمات کلیدی:
ویکی پدیا، متن، مقاله، ویرایش، هستی شناسی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/627057/