تشخیص خطوط حاوی متن در تصاویر اسناد چاپی فارسی

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 458

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

SPIS06_014

تاریخ نمایه سازی: 25 دی 1399

چکیده مقاله:

تشخیص خطوط حاوی متن یکی از گام های کلیدی در روند تبدیل تصویر سند به متن آن است. در سیستم های نویسه خوان نوری (Optical Character Recognition: OCR) یکی از تاثیرگذارترین پیش پردازش ها، تشخیص خطوط حاوی متن است. عدم تشخیص مناسب خطوط، تمامی بخش های بعدی الگوریتم نویسه خوان نوری را دچار اخلال می کند. در این مقاله، روشی نوین برای تشخیص خطوط حاوی متن در تصاویر اسناد چاپی فارسی ارائه شده است. الگوریتم پیشنهادی، از تخمین اندازه قلم متن برای تشخیص دقیق تر خطوط استفاده می کند که تاکنون در کارهای پیشین از آن بهره گرفته نشده است. الگوریتم پیشنهادی ، شامل سه مرحله اصلی است. در مرحله اول، تصویر اصلی رفع نویز شده و خطوط زائد حذف می شود. در مرحله بعد، برای تمامی مولفه های متصل به هم (Connected Component:CC) اندازه قلم مشخص می شود و سپس پر تکرارترین اندازه قلم، به عنوان اندازه قلم نهایی تصویر در نظر گرفته می شود. در نهایت تمام CC های موجود در شعاع همسایگی افقی هر CC، مشخص شده و به CC اصلی متصل خواهند شد. اندازه شعاع همسایگی، ضریبی از اندازه قلم نهایی است. برای قلم های با اندازه بزرگتر، این شعاع بزرگتر خواهد بود. الگوریتم پیشنهادی بر روی دیتاستی از تصاویر با بیش از 2000 خط آژمون و به دقت 99/3% رسیده است.

نویسندگان

امیررضا فاتح

دانشجوی کارشناسی ارشد، دانشکده مهندسی کامپوتر، دانشگاه صنعتی شاهرود، شاهرود،

منصور فاتح

استادیار دانشکده مهندسی کامپوتر، دانشگاه صنعتی شاهرود، شاهرود

علیرضا تجری

استادیار دانشکده مهندسی کامپوتر، دانشگاه صنعتی شاهرود، شاهرود