بهبود عملکرد حمله در تیم ربات های فوتبالیست با استفاده از یادگیری تقویتی

سال انتشار: 1397
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 496

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_TJEE-48-2_011

تاریخ نمایه سازی: 17 تیر 1398

چکیده مقاله:

به دلیل عدم امکان پیش بینی همه وضعیت های ممکن برای عامل ها در یک سیستم چندعامله ی پویا و گسترده، روش های یادگیری ماشین، ابزار مناسبی برای کنترل رفتار عامل ها می باشد. فوتبال شبیه سازی شده ربات ها یک مسئله شناخته شده برای ارزیابی الگوریتم های یادگیری ماشین روی سیستم های چندعامله است. در این مقاله الگوریتم یادگیری کیو وی (یکی از الگوریتم های معروف یادگیری تقویتی) جهت بهبود عملکرد حمله در تیم ربات های فوتبالیست دو بعدی بکار گرفته شده است. سیگنال تقویتی براساس اینکه بازیکنانی که در حمله دخالت دارند، توپ را جلوی دروازه می رسانند، یا اینکه توپ را از دست می دهند، تعریف شده است و به ترتیب عامل ها با توجه به وضعیت ذکرشده، جایزه و جریمه دریافت می کنند. جهت بهبود عملکرد از ایده تقسیم سیگنال تقویتی متناسب با مقدار خبرگی عامل ها در یک سیستم چندعامله استفاده شده است. در اینجا میزان خبرگی متناسب با تفاوت ارزش عمل با بالاترین ارزش با ارزش عمل با کمترین مقدار ارزش در هر حالت تعریف می شود. نتایج شبیه سازی نشان می دهد، بهره گیری از ایده تقسیم سیگنال تقویتی براساس خبرگی در آموزش باعث افزایش سرعت در آموزش و بهبود عملکرد عامل ها شده است.

کلیدواژه ها:

نویسندگان

مینا خاکسار

دانشگاه یزد - پردیس فنی و مهندسی - گروه مهندسی کامپیوتر

ولی درهمی

دانشگاه یزد - پردیس فنی و مهندسی - گروه مهندسی کامپیوتر

مهدی رضائیان

دانشگاه یزد - پردیس فنی و مهندسی - گروه مهندسی کامپیوتر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • مینا خاکسار، ولی درهمی و مهدی رضائیان، بهبود عملکرد حمله ...
  • عادل اکبری مجد، حسین شایقی، حمید محمدنژاد، عبداله یونسی، کنترل ... [مقاله ژورنالی]
  • مریم رمضانیان لنگرودی، سیدمازیار میرحسینی مقدم، بهنام علیزاده، استفاده از ... [مقاله ژورنالی]
  • F. Almeida, N. Lau, and L. P. Reis, A Survey ...
  • M. Alavi, M. F. Tarazkouhi, A. Azaran, A. Nouri, S. ...
  • M. Chen et. al., (2003) RoboCup Soccer Server for Soccer ...
  • J. R. F. Neri, M. R. Zatelli, C. H. F. ...
  • M. Ghazanfari, S. O. Shirkhorshidi, and F. Samsamipour, Axiom 2013 ...
  • S. Kalyanakrishnan, Y. Liu, and P. Stone, Half field offense ...
  • H. Akiyama, T. Nakashima, and K. Yamashita, Helios2013 team description ...
  • T. Sirinivasan, K. Aarthi, S. A. Meenakshi, and M. Kausalya, ...
  • A. Bai, H. Zhang, G. Lu, M. Jiang, and X. ...
  • S. Marian, D. Luca, B. Sarac, and O. Cotarlea, OXSY ...
  • H. Akiyama, T. Nakashima, and K. Yamashita, HELIOS2014 Team Description ...
  • M. Yoon, Developing basic soccer skills using reinforcement learning for ...
  • R. S. Sutton and A. G. Barto, Reinforcement learning: An ...
  • نمایش کامل مراجع