استفاده از رگرسیون غیرخطی و ویژگی های آماری جهت ارزیابی سیستم های (Interactive Question Answering (IQA

سال انتشار: 1397
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 606

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_SAIRAN-9-3_001

تاریخ نمایه سازی: 30 مهر 1398

چکیده مقاله:

مشکل اصلی در طراحی سیستم های پرسش و پاسخ تعاملی، عدم امکان پیش گویی بخش تعاملی این سیستم ها است. به همین منظور، باید انسان در فرآیند ارزیابی شرکت داشته باشد. در این مقاله با معرفی مجموعه ای از ویژگی های ایجاد شده بر اساس n-گرم ها و بزرگترین رشته مشترک، یک مدل آماری مناسب برای ارزیابی سیستم های پرسش و پاسخ تعاملی ارائه شده است. در ابتدا با استفاده از چهار سیستم پرسش و پاسخ تعاملی موجود، پایگاه داده ای از مکالمات رد و بدل شده بین کاربران و سیستم ها ایجاد گردید. از بین مکالمات تولید شده، تعداد 540 نمونه به عنوان داده مناسب در نظر گرفته شد تا مجموعه تست و آموزش بر اساس آن ایجاد گردد. سپس بر روی مکالمات، پیش پردازش صورت پذیرفت و بر اساس روابط تعریف شده، تعدادی ویژگی آماری جدید از متن مکالمه ها استخراج و بر اساس آن ماتریس ویژگی تشکیل گردید. با توجه به تعداد بالای ویژگی های پیشنهادی و برای جلوگیری از برازش خطا، بهترین ویژگی ها با استفاده از روش حذف ویژگی به روش بازگشتی انتخاب گردید تا مدل پیشنهادی بر اساس ویژگی های باقیمانده شکل گیرد. در نهایت با استفاده از رگرسیون به پیش بینی نظرات انسانی پرداخته شد که رگرسیون غیرخطی توانی بر اساس معیار مجذور کمترین مربع خطا به میزان 15/0 بهترین مدل را ارائه نمود

کلیدواژه ها:

رگرسیون غیرخطی ، استخراج ویژگی ، ارزیابی ، سیستم پرسش و پاسخ تعاملی

نویسندگان

محمدمهدی حسینی

دانشگاه آزاد شاهرود، استادیار دانشکده کامپیوتر

مرتضی زاهدی

دانشگاه صنعتی شاهرود، دکتری کامپیوتر

حمید حسن پور

دانشگاه صنعتی شاهرود، دکتری کامپیوتر