بهینه سازی مسیر ربات با به کارگیری یادگیری تقویتی

نکیسا, کیانی

بهینه سازی مسیر ربات با به کارگیری یادگیری تقویتی

عنوان مقاله: بهینه سازی مسیر ربات با به کارگیری یادگیری تقویتی
شناسه ملی مقاله: STSEE01_055
منتشر شده در اولین همایش تخصصی علوم ، فناوری و سامانه های مهندسی برق در سال 1392

مشخصات نویسندگان مقاله:

نکیسا کیانی - دانشگاه سیستان و بلوچستان، دانشجوی کارشناسی ارشد گروه علوم کامپیوتر

خلاصه مقاله:

همراه با توسعه فناوری ربات، یک ربات نه تنها نیازمند تکمیل یک کار خاص است، بلکه مستلزم طرح ریزی مسیر در روند اجرای آن کار نیز می باشد. این مقاله یک روش طرح ریزی مسیر ربات، مبتنی بر یادگیری تقویتی را با هدف فرایند تصمیم گیری مارکوف معرفی مینماید. در این مقاله، مفهوم بنیادی، اصول و روش یادگیری تقویتی و برخی از الگوریتم های دیگر مطرح شده است. سپس، طرح ریزیمسیر ربات واحدی در محیط ایستا مبتنی بر یادگیری- Q مورد مطالعه قرارگرفته و کاربرد این الگوریتم بر روی طرح ریزی مسیر از طریق تنظیم فضای حرکت و عمل و طرح ریزی تابع تقویتی توصیف شده است . برخی از آزمایشات را از طریق شبیه سازی در نرم افزار متلب، که این الگوریتم را به صورت بصری مجسم می کنند، انجام شده و مسیر بهینه به دست آمده است

کلمات کلیدی:

یادگیری تقویتی، فرایند تصمیم گیری مارکوف، یادگیری- Q

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/221067/