CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بهبود استخراج قسمت‌های متنی در سند تصویری با استفاده از تبدیل موجک و الگوریتم‌ ژنتیک مبتنی بر ویژگی‌های بافتی و شکلی

عنوان مقاله: بهبود استخراج قسمت‌های متنی در سند تصویری با استفاده از تبدیل موجک و الگوریتم‌ ژنتیک مبتنی بر ویژگی‌های بافتی و شکلی
شناسه ملی مقاله: ICMVIP05_008
منتشر شده در پنجمین کنفرانس ماشین بینایی و پردازش تصویر در سال 1387
مشخصات نویسندگان مقاله:

مهدی فارسی عباس آبادی - کارشناس ارشد،گروه مهندسی کامپیوتر -دانشگاه آزاد اسلامی واحد شهریار - ش
نصرا... مقدم چرکری - استادیار،گروه مهندسی کامپیوتر - دانشگاه تریبت مدرس

خلاصه مقاله:
جدا کردن اطلاعات ( متنی / تصویری ) از یک تصویر اسکن شده، یکی از نیازهای اجتناب ناپذیر در استخراج، جستجو و طبقه بندی اطلاعات می باشد . در فایل های تصویری با قالب های مختلف، دسترسی به اطلاعات متنی به منظور طبقه بندی تصاویر و جستجوی اطلاعات موجود در تصویر غیر ممکن است برای رسیدن به این مقصود، ابتدا سند با استفاده از روش تبدیل موجک قطعه بندی می شود،زیرا قطعه بندی مرحله مهمی در آنالیز و تشخیص نوع نواحی ( متن / تصویر ) در سند است، سپس شناسایی مناطق متنی توسط یک طبقه بند SVM انجام می گیرد،در این راستا برای بهبود شناسایی قطعات متنی از تصویری، علاوه بر ویژگی های حاصل از بافت تصویر از ویژگی های شکلی نیز استفاده می شود . بدلیل اینکه ابعاد ویژگی های استفاده شده برای شناسایی قطعات متنی توسط طبقه بند زیاد می باشد،از الگوریتم های تکاملی مانند ژنتیک برای کاهش ابعاد استفاده شده است .آزمایشات بر روی 1000 سند که از اینترنت گرفته شده است انجام شده است . اسناد مورد آزمایش از زبان های مختلف شامل فارسی،انگلیسی،چینی،ژاپنی و یونانی انتخاب گردیده است . نتایج آزمایشات نشان می دهد که قسمت های متنی نسبت به روش های دیگر بهتر بازیابی می شود . الگوریتم ارائه شده حدود 1 ، %95 قطعات را بدرستی تشخیص می دهدو پیچیدگی محاسبتی الگوریتم نسبت به حالت های قبل کمتر و زمان بازیابی قطعات متنی کاهش یافته است.

کلمات کلیدی:
قطعه‌بندی، تبدیل موجک، تشخیص متن، ویژگی‌های شکلی، الگوریتم ژنتیک، SVM

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/51984/