بهبود استخراج قسمتهای متنی در سند تصویری با استفاده از تبدیل موجک و الگوریتم ژنتیک مبتنی بر ویژگیهای بافتی و شکلی
محل انتشار: پنجمین کنفرانس ماشین بینایی و پردازش تصویر
سال انتشار: 1387
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,385
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICMVIP05_008
تاریخ نمایه سازی: 29 اردیبهشت 1387
چکیده مقاله:
جدا کردن اطلاعات ( متنی / تصویری ) از یک تصویر اسکن شده، یکی از نیازهای اجتناب ناپذیر در استخراج، جستجو و طبقه بندی اطلاعات می باشد . در فایل های تصویری با قالب های مختلف، دسترسی به اطلاعات متنی به منظور طبقه بندی تصاویر و جستجوی اطلاعات موجود در تصویر غیر ممکن است برای رسیدن به این مقصود، ابتدا سند با استفاده از روش تبدیل موجک قطعه بندی می شود،زیرا قطعه بندی مرحله مهمی در آنالیز و تشخیص نوع نواحی ( متن / تصویر ) در سند است، سپس شناسایی مناطق متنی توسط یک طبقه بند SVM انجام می گیرد،در این راستا برای بهبود شناسایی قطعات متنی از تصویری، علاوه بر ویژگی های حاصل از بافت تصویر از ویژگی های شکلی نیز استفاده می شود . بدلیل اینکه ابعاد ویژگی های استفاده شده برای شناسایی قطعات متنی توسط طبقه بند زیاد می باشد،از الگوریتم های تکاملی مانند ژنتیک برای کاهش ابعاد استفاده شده است .آزمایشات بر روی 1000 سند که از اینترنت گرفته شده است انجام شده است . اسناد مورد آزمایش از زبان های مختلف شامل فارسی،انگلیسی،چینی،ژاپنی و یونانی انتخاب گردیده است . نتایج آزمایشات نشان می دهد که قسمت های متنی نسبت به روش های دیگر بهتر بازیابی می شود . الگوریتم ارائه شده حدود 1 ، %95 قطعات را بدرستی تشخیص می دهدو پیچیدگی محاسبتی الگوریتم نسبت به حالت های قبل کمتر و زمان بازیابی قطعات متنی کاهش یافته است.
کلیدواژه ها:
نویسندگان
مهدی فارسی عباس آبادی
کارشناس ارشد،گروه مهندسی کامپیوتر -دانشگاه آزاد اسلامی واحد شهریار - ش
نصرا... مقدم چرکری
استادیار،گروه مهندسی کامپیوتر - دانشگاه تریبت مدرس
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :