بهبود استخراج قسمت‌های متنی در سند تصویری با استفاده از تبدیل موجک و الگوریتم‌ ژنتیک مبتنی بر ویژگی‌های بافتی و شکلی

سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,385

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICMVIP05_008

تاریخ نمایه سازی: 29 اردیبهشت 1387

چکیده مقاله:

جدا کردن اطلاعات ( متنی / تصویری ) از یک تصویر اسکن شده، یکی از نیازهای اجتناب ناپذیر در استخراج، جستجو و طبقه بندی اطلاعات می باشد . در فایل های تصویری با قالب های مختلف، دسترسی به اطلاعات متنی به منظور طبقه بندی تصاویر و جستجوی اطلاعات موجود در تصویر غیر ممکن است برای رسیدن به این مقصود، ابتدا سند با استفاده از روش تبدیل موجک قطعه بندی می شود،زیرا قطعه بندی مرحله مهمی در آنالیز و تشخیص نوع نواحی ( متن / تصویر ) در سند است، سپس شناسایی مناطق متنی توسط یک طبقه بند SVM انجام می گیرد،در این راستا برای بهبود شناسایی قطعات متنی از تصویری، علاوه بر ویژگی های حاصل از بافت تصویر از ویژگی های شکلی نیز استفاده می شود . بدلیل اینکه ابعاد ویژگی های استفاده شده برای شناسایی قطعات متنی توسط طبقه بند زیاد می باشد،از الگوریتم های تکاملی مانند ژنتیک برای کاهش ابعاد استفاده شده است .آزمایشات بر روی 1000 سند که از اینترنت گرفته شده است انجام شده است . اسناد مورد آزمایش از زبان های مختلف شامل فارسی،انگلیسی،چینی،ژاپنی و یونانی انتخاب گردیده است . نتایج آزمایشات نشان می دهد که قسمت های متنی نسبت به روش های دیگر بهتر بازیابی می شود . الگوریتم ارائه شده حدود 1 ، %95 قطعات را بدرستی تشخیص می دهدو پیچیدگی محاسبتی الگوریتم نسبت به حالت های قبل کمتر و زمان بازیابی قطعات متنی کاهش یافته است.

نویسندگان

مهدی فارسی عباس آبادی

کارشناس ارشد،گروه مهندسی کامپیوتر -دانشگاه آزاد اسلامی واحد شهریار - ش

نصرا... مقدم چرکری

استادیار،گروه مهندسی کامپیوتر - دانشگاه تریبت مدرس

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • مهدی فارسی عباس آبادی، نصرا... مقدم چرکری، "روشی جدید برای ...
  • Qixiang Ye, Qingming Huang, Wen Gao and Debin and robust ...
  • _ Nagy., *Twenty years of document image analysis in PAMI. ...
  • A. K. Jain and B. Yu., «Document representation and its ...
  • N. Amamoto, S. Torigoe, and Y. Hirogaki, _ Segmentation and ...
  • M. Acharyya and M.K. Kundu, *Document Image Segmentation Using Wavelet ...
  • A. Busch _ W.W. Boles, S. Sridharan. 0Texture for script ...
  • S. Mao and T. Kanungo. *Empirical performance evaluation methodology and ...
  • Y. Qiao, Z. Lu, C. Song and S. Sun. «Document ...
  • th Iranian Conference On Machine Vision and Image Processing, November ...
  • based methods, Systems and Control in Aerospace and Astronautics, ISSCAA. ...
  • H.Li, D. Doermann, O. Kia, ، Automuatic text detection and ...
  • R. Lienhart, A. Wernicke, "Localizing and segmenting text in images ...
  • S. Seiden, M. Dillencourt, S. Irani, R. Berrey, and T. ...
  • Y.S. Kim, W. Y. Kim, _ _ ontent-based trademark retrieval ...
  • M. Hung, C. Hsieh and C. Kuo, *Similarity retrieval of ...
  • P.Y Yin, C.C Yeh, _ _ ontent-based retrieval from trademark ...
  • th Iranian Conference On Machine Vision and Image Processing, November ...
  • نمایش کامل مراجع