بازشناسی رشته ارقام دست نویس با استفاده از شبکه های عصبی انتها-به-انتها تماما مبتنی بر لایه های پیچشی

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 150

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSICC28_015

تاریخ نمایه سازی: 27 اسفند 1401

چکیده مقاله:

مساله بازشناسی رشته ارقام دست نویس به دلیل اهمیت کاربرد آن طی سال های اخیر به یک موضوع تحخقیقاتی در حوزهتحقیقات دانشگاهی و صنعت تبدیل شده است. این مساله را می توان حالت محدودتر مساله بازشناسی متن دست نوشته دانست چرا که لیست واژگان آن تنها محدود به ارقام است. با این حال این مساله چالش های متفاوتی نسبت به بازشناسی متن دست نوشته دارد. در این مساله معمولا بکارگیری مدل زبانی به منظور بهبود دقت بازشناسی چندان موثر و کارا نیست. در این مقاله یک مدلانتها-به-انتها که تماما مبتنی بر لایه های پیچشی است برای حل این مساله پیشنهاد داده شده است. همچنین در این مدل پیشنهادی از معماری لایه پیچشی دروازه ای بهره برده ایم. برای ارزیابی مدل پیشنهادی به لحاظ منصفانه بودن مقایسه نتایج ما با نتایج ارائه شده توسط پژوهش های پیشین از مجموعه دادگان A_CAR ORAND و B_CAR ORAND و معیارهای ارزیابی که در مسابقه ۲۰۱۴ ICFHR معرفی شده اند استفاده کرده ایم. است. دقت نتایج حاصل از اجرای مدل پیشنهادی بر روی دادگان های ORANDA_CAR و B_CAR ORAND به ترتیب برابر ۹۴.۵۳% و ۹۴.۹۴% است

کلیدواژه ها:

یادگیری ژرف ، بازشناسی رشته ارقام دست نویس ، بازنشانی متن دست نوشته ، شبکه عصبی انتها- به - انتها ، شبکه عصبی پیچشی دروازه ای

نویسندگان

باقر باباعلی

دانشکده ریاضی، آمار و علوم کامپیوتر، دانشگاه تهران