روشی جدیددربازشناسی زبان فارسی بااستفاده ازپالایش گرامری
محل انتشار: اولین کنفرانس بازشناسی الگو و پردازش تصویر ایران
سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 668
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IPRIA01_118
تاریخ نمایه سازی: 11 مرداد 1393
چکیده مقاله:
بازشناسی متون یکی ازموضوعات تحقیقاتی درحال رشد درسالهای اخیر است تاکنون الگوریتم های زیادی به این منظورارایه و پیشنهاد شده اند که بربازشناسی شبه کلمات یاحروف متمرکز بوده اند دراین مقاله ازترکیب دوشاخه علمی پردازش تصویر وپردازش زبانهای طبیعی یک الگوریتم سه مرحله ای به منظور بازشناسی متون فارسی برمبنای بازشناسی جملات فارسی ارایه می شود این روش شامل مراحل استخراج شبه کلمات ساخت کلمات و سپس جملات بالقوه معن یدارودرنهایت استفاده ازدومدل زبانی و چندقاعده گرامری به منظور تشخیص جمله صحیح براساس انطباق باگرامررایج زبان فارسی می باشد ازمایشات متعدد نشان میدهد که دقت روش ارایه شده برای مرحله استخراج شبه کلمات برابر 92درصد برای ساخت کلمات و سپس جملات بالقوه معنی دار 98درصد و 85درصد برای تشخیص جمله صحیح با استفاده ازمدل زبانی بایگرام و89درصد برای مدل زبانی ترایگرام است
کلیدواژه ها:
نویسندگان
پریسا شیروانی
نویسنده اول کارشناس ارشددانشگاه سمنان دانشکده برق وکامپیوتر
مهرداد وطن خواه خوزانی
نویسنده دوم کارشناس ارشددانشگاه shefild hallam uni دانشکده برق و کامپیوتر
سیدمرتضی نوریان نجف آبادی
نویسنده سوم کارشناس ارشددانشگاه بیرجند دانشکده برق و کامپیوتر
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :