CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

استفاده از رگرسیون غیرخطی و ویژگی های آماری جهت ارزیابی سیستم های (Interactive Question Answering (IQA

عنوان مقاله: استفاده از رگرسیون غیرخطی و ویژگی های آماری جهت ارزیابی سیستم های (Interactive Question Answering (IQA
شناسه ملی مقاله: JR_SAIRAN-9-3_001
منتشر شده در شماره 3 دوره 9 فصل پاییز در سال 1397
مشخصات نویسندگان مقاله:

محمدمهدی حسینی - دانشگاه آزاد شاهرود، استادیار دانشکده کامپیوتر
مرتضی زاهدی - دانشگاه صنعتی شاهرود، دکتری کامپیوتر
حمید حسن پور - دانشگاه صنعتی شاهرود، دکتری کامپیوتر

خلاصه مقاله:
مشکل اصلی در طراحی سیستم های پرسش و پاسخ تعاملی، عدم امکان پیش گویی بخش تعاملی این سیستم ها است. به همین منظور، باید انسان در فرآیند ارزیابی شرکت داشته باشد. در این مقاله با معرفی مجموعه ای از ویژگی های ایجاد شده بر اساس n-گرم ها و بزرگترین رشته مشترک، یک مدل آماری مناسب برای ارزیابی سیستم های پرسش و پاسخ تعاملی ارائه شده است. در ابتدا با استفاده از چهار سیستم پرسش و پاسخ تعاملی موجود، پایگاه داده ای از مکالمات رد و بدل شده بین کاربران و سیستم ها ایجاد گردید. از بین مکالمات تولید شده، تعداد 540 نمونه به عنوان داده مناسب در نظر گرفته شد تا مجموعه تست و آموزش بر اساس آن ایجاد گردد. سپس بر روی مکالمات، پیش پردازش صورت پذیرفت و بر اساس روابط تعریف شده، تعدادی ویژگی آماری جدید از متن مکالمه ها استخراج و بر اساس آن ماتریس ویژگی تشکیل گردید. با توجه به تعداد بالای ویژگی های پیشنهادی و برای جلوگیری از برازش خطا، بهترین ویژگی ها با استفاده از روش حذف ویژگی به روش بازگشتی انتخاب گردید تا مدل پیشنهادی بر اساس ویژگی های باقیمانده شکل گیرد. در نهایت با استفاده از رگرسیون به پیش بینی نظرات انسانی پرداخته شد که رگرسیون غیرخطی توانی بر اساس معیار مجذور کمترین مربع خطا به میزان 15/0 بهترین مدل را ارائه نمود

کلمات کلیدی:
رگرسیون غیرخطی, استخراج ویژگی, ارزیابی, سیستم پرسش و پاسخ تعاملی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/950623/