کنترل بهینه ربات تک لینکی غیرخطی به روش یادگیری تقویتی Q-Learning

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 147

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NEEC07_055

تاریخ نمایه سازی: 3 اردیبهشت 1403

چکیده مقاله:

در این مقاله، کنترل بهینه سیستم های رباتیک با دینامیک نامعلوم با استفاده از روش یادگیری تقویتی ارائه شده است. از بین روش های مختلف یادگیری تقویتی، در اینجا از الگوریتم Q-Learning مبتنی بر تکنیک تکرار سیاست استفاده شده است. در این الگوریتم از ساختار بازیگر-منتقد بهره گرفته می شود، که بر اساس آن معادله غیرخطی همیلتون-یاکوبی-بلمن بطور بر خط و با استفاده از شبکه های عصبی حل شده است. در ضمن با وجود دینامیک نامعلوم پلنت، مسئله کنترل بهینه با مینیمایز کردن تابع هزینه حل می گردد. روش ارائه شده بر روی ربات تک لینکی به کار رفته و در نرم افزار متلب شبیه سازی شده است.

کلیدواژه ها:

نویسندگان

سجاد صابری

دانشکده مهندسی برق، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران

عباس چترایی

دانشکده مهندسی برق، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران

خوشنام شجاعی

دانشکده مهندسی برق، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایرانمرکز تحقیقات پردازش و دیجیتال و بینایی ماشین، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران