شاخص گذاری و بازیابی اطلاعات از پایگاه تصاویر اسناد

سال انتشار: 1385
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,920

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICEE14_167

تاریخ نمایه سازی: 25 تیر 1387

چکیده مقاله:

در این مقاله، یک روش برای بازیابی اطلاعات از تصاویر اسناد فارسی بدون استفاده از بازشناسی نوری حروف معرفی کرده ایم. ابتدا برای ریز کلمات سند یک ویژگی به نام برچسب کانتور بالایی استخراج شده سپس بر مبنای این ویژگی یک دیکشنری تصویری برای ریز کلمات ایجاد شده است. به کمک این روش برای دو مسئله مختلف در بازیابی اسناد با استفاده از جستجوی کلمات کلیدی و بازیابی بر اساس شباهت اسناد راه حل ارائه شد. روشهای ارائه شده بر روی یک پایگاه تصاویر اسناد فارسی ارزیابی شد. نتایج بدست آمده توانایی این روش ها در بازیابی اطلاعات از تصاویر اسناد را تایید کرده است.

نویسندگان

محمد اکبری

دانشکده ریاضی و علوم کامپیوتر، دانشگاه صنعتی امیرکبیر

رضا عرمی

دانشکده فنی و مهندسی، دانشگاه الزهرا

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Image Documentن [12] D.S. Bloomberg, and F.R. Chen, S ummarization ...
  • رضا، عزمی و احسان‌الله، کبیر، _ جداسازی حروف در متون ...
  • رضا، عزمی و احسان‌الله، کبیر، "ایجاد یک دیکشنری از زیر- ...
  • رضا، عزمی، احسان‌الله، کبیر، کامبیز، بدیع، "ارائه یک الگوریتم دسته‌بندی ...
  • رضا، عزمی، احسان‌الله، کبیر، کامبیز، بدیع، "بازشناسی متون چاپی با ...
  • رضا، عزمی، "بازشناسی متون چاپی فارسی"، رساله دکتری، دانشکده فنی ...
  • D. Doermann, ،The Indexing and Retrieval of Document Images: A ...
  • M. Mitra and B.B. Chaudhuri, ،، Information Retrieval from Documents: ...
  • _ Salton, J. Allan, C. Buckley, and A. Singhal, ، ...
  • C ategorization Methods?, Proc. 22th Ann. Int4l ACM SIGIR Conf. ...
  • K. Tagvam, J. Borsack, A. Condir, and S. Erva, ،The ...
  • Y. Ishitani, ،Model-B ased Information Extraction Method Tolerant of OCR ...
  • M. Ohtam, A. Takasu, and J. Adachi, ،#Retrieval Methods for ...
  • S.M. Harding, W.B. Croft, and C. Weir, ،Probabilistic Retrieval of ...
  • European Conf. Research and Advanced Technology for D igitalLibraries (ECDL ...
  • T. Kameshiro, T. Hirano, Y. Okada, and F. Yado, ،A ...
  • K.Katsuyama et al., *Highly Accurate Retrieval of Japanese Document Images ...
  • F.R. Chen and D.S. Bloomberg, _، S ummarization of Imaged ...
  • J. Liu and A.K. Jain, *'Image-Based Form Document Retrieval?, Pattern ...
  • D. Niyogi and S. Srihari, ،The Use of Document Structure ...
  • Y.Y. Tang, C.D. Yan, and C.Y. Suen, ،'Document Processing for ...
  • Y. He, Z. Jiang, B. Liu, H. Zhao, ، Content- ...
  • A.L. Spitz, *Duplicate Document Detection?, Proc. SPIE, Document Recognition IV, ...
  • A.F. Smeaton and A.L. Spitz, *Using Character Shape Coding for ...
  • A.L. Spitz, *Shape-Based Word Recognition', Int'l J. Document Analysis and ...
  • A.L. Spitz, *Progress in Document Recon struction', Proc. _ Pattern ...
  • Z. Yu and C.L. Tan, *'Image-Based Document Vectors for Text ...
  • C.L. Tan, W. Huang, Z. Yu, and Y. Xu, *Imaged ...
  • T.K. Ho, J.J. Hull, and S.N. Srihari, ،0A Word Shape ...
  • T. S yeda- Mahmood, *Indexing of Handwritten Document _ Proc. ...
  • A. Kolcz, J. Alspector, M. Augusteijn, R. Carlson, and G.V. ...
  • R. Manmatha, C. Han, and E.M. Ri seman, ?Word Spotting: ...
  • J. DeCurtins and E. Chen, *Keyword Spotting via Word Shape ...
  • S. Kuo and O.F. Agazzi, *Keyword Spotting in Poorly Printed ...
  • F.R. Chen, L.D. Wilcox, and D.S. Bloomberg, ،Word Spotting in ...
  • F.R. Chen, L.D. Wilcox, and D.S. Bloomberg, "Detecting and Locating ...
  • Images Using Hidden Markov Models', Proc Int?l Conf. Document Analysis ...
  • Y. Lu, C.L. Tan, W. Huang, and L.Fan, _ An ...
  • R. Azmi, E. Kabir, _ Recognition Algorithm for Hand- printed ...
  • R. Azmi, E. Kabir, ،0 A New segmentation Technique for ...
  • J. J. Hall, ،Word Shape Analysis in a Knowledge-b ased ...
  • J. J. Hall, S. N. Srihari, _ C omputational Approach ...
  • نمایش کامل مراجع