بررسی بهبود تشخیص ویژگی در سیستم پاسخ و پرسش بصری

امیرحسین ساجدی

بررسی بهبود تشخیص ویژگی در سیستم پاسخ و پرسش بصری

محل انتشار: بیستمین کنفرانس ملی علوم و مهندسی کامپیوتر و فناوری اطلاعات

سال انتشار: 1402

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 105

فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1755718

شناسه ملی سند علمی:

CECCONF20_014

تاریخ نمایه سازی: 18 شهریور 1402

چکیده مقاله:

امروزه با توجه به پیشرفت روز افزون سیستم های نظارتی، شناسایی و گسترش الگوریتم های کارآمد در حوزهبینایی کامپیوتر و سیستم های پاسخ و پرسش بصری حائز اهمیت است. در این راستا تشخیص پاسخ دقیق بهدلیل کاربرد گسترده ای که در موارد متعددی نظیر نظارت خودکار، تحلیل تصاویر، پیش بینی وقایع، اقدام سریع وغیره دارد، به یکی از موضوعات مهم تحقیق در زمینه شناسایی الگو و بینایی ماشین تبدیل شده است. فرآینداستخراج ویژگی، یکی از بخش های مهم در سیستم هوشمند محسوب می شود. در سیستم پاسخ و پرسش بصری،استخراج ویژگی ها با چالش هایی همچون سبک های شخصی، ظاهر متفاوت، دیدگاه دوربین، پس زمینه متغیر ودیگر تغییرات محیطی مواجه است. در این مقاله با پیاده سازی شبکه های عصبی کانولوشنی در معماری YOLOبه استخراج ویژگی های تصاویر پرداخته می شود؛ سپس از تعبیه گذاری کلمات به صورت برداری به جهت ایجادبستر ارتباطی در پیاده سازی سیستم پاسخ و پرسش بصری و نهایتا بهبود شبکه توجه در این سیستم پرداختهمی شود. در این مقاله از پایگاه داده های VQA۲ ،VQA۱ و Visual Genome به منظور آموزش و بررسی دقت نهایی استفاده شده است. دقت به دست آمده در روش پیشنهادی در پایگاه داده AQA۱ و در معماری YOLO برابر ۶۱۸ برابر ۶۱۸ درصد می باشد.

کلیدواژه ها:

پرسش و پاسخ بصری ، پردازش تصویر ، یادگیری عمیق ، شبکه عصبی کانولوشنی

نویسندگان

امیرحسین ساجدی

دانش آموخته کارشناسی ارشد هوش مصنوعی، دانشگاه سمنان