الگوریتمی خود یادگیر برای رهگیری هدف متحرک توسط گروهی از عامل های هوشمند
محل انتشار: هشتمین کنفرانس ملی فرماندهی و کنترل ایران (C۴I)
سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 661
فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CCCI08_105
تاریخ نمایه سازی: 14 دی 1394
چکیده مقاله:
همکاری گرهی از عامل ها به منظور تامین یک هدف مشترک و ماکزیمم سازی منفعت جمعی مسئله ای بسیار پر کاربرد و مورد توجه می باشد در این مقاله مسئله رهگیری یک هدف متحرک توسط گروهی از عامل های خود مختار در یک فضای پیوسته مورد توجه قرار می گیرد.ترکیبی از یادگیری Qو کنترل فازی به عنوان پایه و اساس روش ارائه شده برای همکاری بین عامل ها در تعقیب هدف متحرک مطرح گردیده است مزیت اصلی یادگیری تقویتی آن است که سیستم با تعامل مستقیم با محیط و بدون در اختیار داشتن داده های آموزشی فبلی یادگیری را انجام می هدهد همچنین استفاده از روش کنترل فازی که زیر مجموعه ای از روشهای کنترل هوشمتد می باشند به دلیل کارایی فراوان در کنترل عامل های هوشمند در زمانی که مدل محیط بسیار پیجیده و یا در دسترس نیست در سالهای اخیر بسیار مورد توجه قرار گرفته است اشگال اصلی الگریتم یادگیری Q به منظور مدل سازی مسئله رهگیری در فضای پیوسته آن است که در این فضا تعداد حالات و اعمال پیش روی هر عامل بسیار زیاد می باشند لذا الگوریتم یادگیری Q ارائه شده توسط آقای واتکینز کارا نمی باشد.
کلیدواژه ها:
نویسندگان
اشکان مقدسی
دانشجوی کارشناسی ارشد رشته هوش مصنوعی
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :