طراحی و ارزیابی نمایهساز خودکار متون فارسی

سال انتشار: 1384
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,112

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI11_100

تاریخ نمایه سازی: 5 آذر 1390

چکیده مقاله:

استفاده از نمایههای تهیه شده از اسناد، مهمترین معیار جستجو و تشخیص اسناد مرتبط به پرسش کاربر در سیستمهای بازیابی اطلاعات است. از این رو تهیه خودکار نمایههای متن یکی از مسایل پایهای و ضروری در سیستمهای بازیابی اطلاعات است. در مقاله حاضر با توجه به مطالعات انجام گرفته در روند نمایهسازی در روشهای دستی و کامپیوتری، نمایهساز خودکار سینا برای متون فارسی طراحی و پیادهسازی شده است. همچنین ریشهیاب خودکاری برای سینا طراحی شده است که به منظور کاهش حجم نمایه و استفاده از ریشه کلمات فارسی در محل نگهداری نمایهها به جای نگهداری همه واژهها استفاده میشود. به منظور وزندهی به نمایههای ایجاد شده توسط سینا از چهار روش وزندهی استفاده شده و مورد ارزیابی قرار گرفته است. در پایان ریشهیاب و نمایهساز خود را مورد ارزیابی قرار دادهایم.

نویسندگان

حسن بشیری

مدرسدانشکده مهندسی کامپیوتردانشگاه بوعلی سینا

فاطمه کربلایی

دانشجوی کارشناسی نرمافزاردانشگاه بوعلی سینا

شیرین موسوی

دانشجوی کارشناسی نرمافزاردانشگاه بوعلی سینا