استفاده ازشکل دهی پاداش دریادگیری مشارکتی مبتنی برخبرگی

فاطمه سارانی راد; علی اکرمی زاده

استفاده ازشکل دهی پاداش دریادگیری مشارکتی مبتنی برخبرگی

محل انتشار: دوازدهمین کنفرانس ملی سیستم های هوشمند ایران

سال انتشار: 1392

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 646

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/276238

شناسه ملی سند علمی:

ICS12_158

تاریخ نمایه سازی: 11 مرداد 1393

چکیده مقاله:

استفاده ازتجربه های عاملهای دیگردریک محیط چندعامله باعث میشود که یک عامل کمتردچاراشتباه و خطا شود و ازتجربه های عاملهای دیگردربدست اوردن حداکثر کارایی استفاده کند برای استفاده ازدانش صحیح عاملهای دیگردرطی فرایندیادگیری ازیکسری معیارهای سنجش خبرگی عاملها استفاده میشود همچنین برای تسریع فرایندیادگیری دریادگیری تقویتی ازتکنیک شکل دهی پاداش استفاده میشود دراین مقاله یک روش ترکیبی جدید مبتنی برشکل دهی پاداش و اشتراک وزن داراستراتژی درطی فرایند یادگیری دریک محیط چندعامله پیشنهادداده شده است روش پیشنهادی موجب تسریع فرایندیادگیری و دستیابی به حداکثر پاداش شده است نتایج تجربی کارایی روش پیشنهادی درفرایند یادگیری روی محیط شبیه سازی را نشان میدهد

کلیدواژه ها:

یادگیری تقویتی ، شکل دهی پاداش ، سیستم چندعامله ، یادگیری Q

نویسندگان

فاطمه سارانی راد

دانشجوی کارشناسی ارشدعلوم تصمیم ومهندسی دانش دانشگاه علوم اقتصادی تهران

علی اکرمی زاده

استادیارگروه مهندسی برق و کامپیوتردانشگاه صنعتی خواجه نصیرالدین طوسی تهران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

Kaelbling, L.P., Littman, M.L., Moore, A.W., "Reinforcement Learning: A Survey", ...
Sutton, R.S., Barto, A.G., "Reinforcement learning: An introduction", Cambridge, MA: ...
Wiewiora, Eric., _ 'Potential-based shaping and Q- _ lueinitialization are ...
Devlin, Sam., Kudenko, Daniel, "Dynamic Potential- Based Reward Shaping", 11th ...
Watkins, CJCH., "Learning with delayed rewards , PhD Psychology ...
Department, England, 1989. ...
Whitehead, S., Ballard, D., "A study of cooperative mechanisms for ...
Tan, M., "Multi-agent reinforcement learning: independent vs. cooperative agents ", ...
Nili Ahmadabadi, M., Asadpour, M., Khodaabakhsh, Seyyed H., Nakano, E., ...
cooperative learning", international conference on intelligent robots and systems, 2261-2267, ...
Ritthipravat, P., Maneewarn, T., Wyatt, J., Laowattana, D., "Comparison and ...
Yang, M., Tian, Y., Liu, X., "Cooperative Q-learning based on ...
Nili Ahmadabadi, M., Asadpour, M., "Expertness based cooperative Q-learning", IEEE ...
Norouzzadeh, Sholeh., Bu., soniu, Lucian., Babu'ska, Robert., "Efficient Knowledge Transfer ...
Norouzzadeh, Sholeh., "Shaping Methods to Accelerate Reinforcement Learning: From Easy ...
Nili Ahmadabadi, M., Asadpour, M., "Cooperative Qlearning a Knowledge Sharing ...

نمایش کامل مراجع