CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بهبود شناسایی اشیاء در شبکه های عصبی کانولوشنی با بهره گیری از اطلاعات زمانی در توالی فریم های ویدئویی

عنوان مقاله: بهبود شناسایی اشیاء در شبکه های عصبی کانولوشنی با بهره گیری از اطلاعات زمانی در توالی فریم های ویدئویی
شناسه ملی مقاله: ICMVIP11_007
منتشر شده در یازدهمین کنفرانس ملی و اولین کنفرانس بین‌المللی بینایی ماشین و پردازش تصویر ایران در سال 1398
مشخصات نویسندگان مقاله:

حسن نجف زاده - دانشگاه فردوسی دانشکده مهندسی
سیدعلیرضا سیدین - دانشگاه فردوسی دانشکده مهندسی

خلاصه مقاله:
شناسایی شی ء یکی از زمینه های بینایی ماشین است که در حال حاضر به شدت مبتنی بر یادگیری ماشین است. در دهه گذشته، بخش عمده ای از یادگیری ماشین که تحت عنوان شبکه های عصبی عمیق نیز شناخته می شود با پیشرفت در توانایی محاسبات و دسترسی به داده، کاربردهای فراوانی داشته اند. یکی از زیر مجموعه های شبکه عصبی که برای وظایف مرتبط با تصویر مناسب است شبکه عصبی کانولوشنی نام دارد. این شبکه آموزشمیبیند تا ویژگی های مختلف مانند لبه ها، گوشه ها، و تفاوت های رنگ را در سراسر تصویر جستجو کند و آن ها را به شکل های پیچیده تر ترکیب کند. برای تشخیص شی ء،سیستم باید مکان های اشیاء احتمالی راتخمین زده و طبقه بندی کند. شناسایی شیء با شبکه های کانولوشن هنوز هم به عنوان یک تکنولوژی در حال تکامل است برخلاف دیگر روش های تشخیص که دیگر کاربرد چندانی ندارند. استفاده از اطلاعات زمانی در شبکه های کانولوشنی باعث افزایش دقت در طبقه بندی می شود. در این مقاله با تغیر لایه های تماما متصل شبکه های عصبی کانولوشنی و با بهره گیری از اطلاعات زمانی درتوالی فریم های از ویدئو با استفاده از فیلتر کالمن عملکرد سیستم های شناسایی به طور قابل ملاحظه ای بهبود می یابد با استفاده زا این شبکه جدیدوطبقه بندی SVM به دقت 95/3% بر روی پایگاه داده Washington RGB Object Dataset دست می یابیم.

کلمات کلیدی:
بازشناسی شیئء، شبکه عصبی کانولوشنی، شناسایی شی ء در ویدئو، فیلتر کالمن

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1045146/