روشی جدیددربازشناسی زبان فارسی بااستفاده ازپالایش گرامری

پریسا شیروانی; مهرداد وطن خواه خوزانی; سیدمرتضی نوریان نجف آبادی

روشی جدیددربازشناسی زبان فارسی بااستفاده ازپالایش گرامری

محل انتشار: اولین کنفرانس بازشناسی الگو و پردازش تصویر ایران

سال انتشار: 1391

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 668

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/276009

شناسه ملی سند علمی:

IPRIA01_118

تاریخ نمایه سازی: 11 مرداد 1393

چکیده مقاله:

بازشناسی متون یکی ازموضوعات تحقیقاتی درحال رشد درسالهای اخیر است تاکنون الگوریتم های زیادی به این منظورارایه و پیشنهاد شده اند که بربازشناسی شبه کلمات یاحروف متمرکز بوده اند دراین مقاله ازترکیب دوشاخه علمی پردازش تصویر وپردازش زبانهای طبیعی یک الگوریتم سه مرحله ای به منظور بازشناسی متون فارسی برمبنای بازشناسی جملات فارسی ارایه می شود این روش شامل مراحل استخراج شبه کلمات ساخت کلمات و سپس جملات بالقوه معن یدارودرنهایت استفاده ازدومدل زبانی و چندقاعده گرامری به منظور تشخیص جمله صحیح براساس انطباق باگرامررایج زبان فارسی می باشد ازمایشات متعدد نشان میدهد که دقت روش ارایه شده برای مرحله استخراج شبه کلمات برابر 92درصد برای ساخت کلمات و سپس جملات بالقوه معنی دار 98درصد و 85درصد برای تشخیص جمله صحیح با استفاده ازمدل زبانی بایگرام و89درصد برای مدل زبانی ترایگرام است

کلیدواژه ها:

بازشناسی متن ، فارسی ، مدلسازی زبان فارسی ، پردازش زبانهای طبیعی

نویسندگان

پریسا شیروانی

نویسنده اول کارشناس ارشددانشگاه سمنان دانشکده برق وکامپیوتر

مهرداد وطن خواه خوزانی

نویسنده دوم کارشناس ارشددانشگاه shefild hallam uni دانشکده برق و کامپیوتر

سیدمرتضی نوریان نجف آبادی

نویسنده سوم کارشناس ارشددانشگاه بیرجند دانشکده برق و کامپیوتر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

ابراهیمی، افشین. "استفاده از شکل کلی زیر-کلمات چاپی در بازیابی ...
Amin, A., Kaced, A., Haton, J.P., Mohr, R., _ Handwritter ...
Adab, M., M. B., "Simultaneous segmentation and recognition of Farsi/Latin ...
_ _ _ _ Arabic text using hidden Marcov Model ...
Badie, K., Shimura, M., "Machine recognition of Arabic cursive scripts". ...
Corazza, A., De Mori, R., Gretter, R., Satta, G., "Language ...
Ebrahimi, A., Kabir, E., _ A pictorial dictionary for printed ...
El-Abed, H., Margner, V., "Arabic text recognition Systems- state of ...
Jacobs, C., Simard, P., Rinker, Viola and J., "Text recognition ...
Conference _ Document Analysis (ICDAR'05) ., Vol.2, 2005, pp. 695-699. ...
Khosravi, H., Kabir, E, "Farsi font recognition based _ Sobel-Roberts ...
Rosenfeld, R. "Two decades of statistical language modeling: where do ...
Rosenfeld, R., Chen, S. F. and Zhu, X., _ Whole- ...
_ _ _ Geometric Modeling and Graphics (GMAGO3)", 2003, pp.30. ...
_ _ _ _ analysis and recognition (CEDAR), . 2007. ...
Suzuki, K., Otoo, E.., Wu, K. "Optimizing Two-Pass Connected- Component ...

نمایش کامل مراجع