روشی جدید برای قطعه بندی کلمات به منظور شناسایی زیرکلمات موجود در اسناد قدیمی دست نویس فارسی

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 412

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEEE07_153

تاریخ نمایه سازی: 19 اردیبهشت 1395

چکیده مقاله:

جست و جوی کلمات کلیدی در اسناد و کتب تاریخی دستنویس برای محققان و پژوهشگران علوم مختلف از اهمیت بالایی برخوردار است. از آنجاکه این کتب با گذشت زمان دچار فرسودگی شده اند، لذا تصاویر اسکن شده آنها نیز کیفیت بالایی ندارند؛ بنابراین روش های مبتنی بر بازشناسی حروف بر روی این متون خوب کار نمی کنند و دقت عملکرد بسیار پایینی دارند. قطعه بندی، جزء مهمترین مراحل پیش پردازش در سیستم های بازشناسی حروف محسوب می شود . زیرا خطوط متنی جدا شده در این مرحله و همچنین قطعه بندی زیرکلمات و کاراکترها در مراحل بعد برای تشخیص کلمه و مراحل برچسب گذاری جهت عملیات تشخیص و بازیابی کلمات نیاز خواهند بود. در این مقاله ما یک روش جدید برای قطعه بندی یک سند قدیمی دست نویس به خطوط و سپس به زیرکلمات جدا از هم را ارائه نموده ایم.

نویسندگان

سمیه صبوری

دانشگاه آزاد اسلامی واحد گناباد باشگاه پژوهشگران و نخبگان جوان گناباد، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • [] علی‌آبادی، محمد، " , " روش جدید برای مکان‌یابی ...
  • M. S. Farag, Handvritten Text Recognition System for Automatic Reading ...
  • J, Sadri, y.Akbari, M.Jalili, A.Farahi, M.Habibi, A New System for ...
  • th Jnt'l Conf on Document Analysis and Recognition, vol. 2, ...
  • نمایش کامل مراجع