بررسی و مقایسه نرم افزارهای برچسب زنی در پایگاه داده های حجیم تصویری برای کاربردهای بینایی ماشین

سال انتشار: 1401
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 185

فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

COMCONF09_045

تاریخ نمایه سازی: 14 آذر 1401

چکیده مقاله:

روش های یادگیری ماشین نظارت شده برای تحلیل هوشمند تصویر و فایل ویدیویی نیازمند حجم زیادی از داده های آموزشی هستند که اصطلاحا داده های برچسب دار نامیده می شوند. دیتابیس های بزرگ و برچسب دار نقش بسیار مهمی در اثبات توانمندی های الگوریتم های هوش مصنوعی در کاربردهای دنیای واقعی داشته اند و قادر هستند تا بسیاری از چالش های مربوط به پیاده سازی الگوریتم های بینایی کامپیوتری را کم کنند. ظهور الگوریتم های یادگیری عمیق برای تشخیص محتوای تصویر منجر به ظهور بسیاری از ابزارهای نرم افزاری برای نشانه گذاری یا حاشیه گذاری تصاویر (Image Annotation) شد. نشانه گذاری معمولا شامل مجموعه ای عملیات دستی توسط کاربر انسانی است و ضمن اینکه مستلزم وقت و دقت بسیار زیادی می باشد عاری از خطا هم نیست در صورت رخداد خطا در درج برچسب یا ایجاد ارتباط بین برچسب زده شده و تصاویر اصلی موجود در دیتاست عملا سیستم یادگیری با داده های غلط مواجه خواهد شد و متعاقبا دقت نهایی مدل یادگیری ماشین هم پایین خواهد آمد. لذا استفاده از ابزارهای برچسب زنی قدرتمند می توانند نقش بسزایی در کاهش زمان توسعه و ساخت پایگاه های داده بزرگ برچسب دار و با کیفیت ایفا نمایند. به علت تعدد ابزارهای موجود و کاربری متفاوت آن ها در مسائل طبقه بندی تصاویر، بخش بندی تصویر، آشکارسازی نیاز به این است که مزایا و معایب هریک از این ابزارها به خوبی مقایسه و انطباق آن ها با کاربری مدنظر در طراحی و توسعه سامانه های بینایی ماشین مشخص گردد. لذا در این تحقیق نقاط مشترک و تمایزهای بین نرم افزار برچسب زنی موجود در دست بررسی و تحلیل قرار گرفت. متعاقبا یک مرور ساختاریافته را انجام می دهیم تا مفاهیم و ویژگی های اساسی نرم افزار برچسب زنی مانند سهولت استفاده و درجه خودکارسازی را تدوین کنیم. درنهایت معیارهای مختلفی نظیر ویژگی های پایه ای، امکانات مدیریت دیتاست، فرمت های فایل های قابل پشتیبانی در نرم افزار، امنیت و مسائل دیگر را جهت مقایسه و انتخاب بهترین ابزار برای یک کاربرد خاص را ارائه می دهیم.

کلیدواژه ها:

کلمات کلیدی: یادگیری ماشین ، بینایی ماشین ، یادگیری نظارت شده ، داده های برچسب دار ، تصویر ، ویدیو

نویسندگان

مهدی باحقیقت

استادیار گروه کامپیوتر، دانشگاه بین المللی امام خمینی، قزوین، ایران