کنترل انعطاف پذیر سیگنال ترافیک مبتنی بر توسعه نمایش حالت در روش یادگیری تقویتی عمیق در هنگام وقوع تصادف در تقاطعات شهری

سال انتشار: 1402
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 65

فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JTE-14-4_012

تاریخ نمایه سازی: 14 شهریور 1402

چکیده مقاله:

روش های یادگیری تقویتی عمیق نتایج امیدوارکننده ای را در توسعه کنترل کننده های سیگنال ترافیک نشان داده اند. در این مقاله، انعطاف پذیری یک کنترل­ کننده مبتنی بر یادگیری تقویتی عمیق را در شرایط ترافیک با حجم زیاد و تحت طیف وسیعی از اختلالات محیطی مانند تصادفات، بررسی کرده و یک کنترل کننده قابل اعتماد را در محیط با ترافیک پویا پیشنهاد می ­دهیم. در این روش ،با استفاده از رویکرد گسسته ­سازی هر یک از خیابان­ های چهارراه به سلول­ هایی تقسیم شده وتاثیر اندازه این سلول­ ها به لحاظ متفاوت بودن یا یکسان بودن با یکدیگردر کارآیی الگوریتم بررسی می­ گردد. با انتخاب یک فضای حالت توسعه یافته و متراکم، اطلاعاتی به عامل به عنوان ورودی داده می­ شودکه بتواند درک کاملی از محیط را در اختیار عامل قرار دهد. برای آموزش عامل از روش یادگیری عمیق Q و بازپخش تجربه استفاده شده و مدل پیشنهادی در شبیه ­ساز ترافیک SUMO ارزیابی شده است. نتایج شبیه سازی کارایی روش پیشنهادی را در کاهش طول صف حتی در صورت وجود اختلال تایید می کند.

نویسندگان

زهرا زینلی

دانشجوی دکترا، گروه مهندسی کنترل، دانشکده مهندسی برق و کامپیوتر، دانشگاه تربیت مدرس، ایران

مهدی سجودی

دانشیار، گروه مهندسی کنترل، دانشکده مهندسی برق و کامپیوتر، دانشگاه تربیت مدرس، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • ارزیابی مولفه های موثر بر ارتقای فرهنگ ایمنی ترافیک وکاهش تلفات با موتورسیکلت [مقاله ژورنالی]
  • Bálint, K., Tamás, T. and Tamás, B. (۲۰۲۲) “Deep Reinforcement ...
  • Casas N. (۲۰۱۷) “Deep deterministic policy gradient for urban traffic ...
  • Chu, K.F., Lam, A.Y. and Li, V.O. (۲۰۲۱) “Traffic Signal ...
  • Chu, T., Wang, J., Codecà, L. and Li, Z. (۲۰۱۹) ...
  • Essa, M. and Sayed, T. (۲۰۲۰) “Self-learning adaptive traffic signal ...
  • Gao, J., Shen, Y., Liu, J., Ito, M. and Shiratori, ...
  • Genders, W. and Razavi., S. (۲۰۱۶) “Using a deep reinforcement ...
  • Gong, Y., Abdel-Aty, M., Yuan, J. and Cai, Q. (۲۰۲۰) ...
  • Jamil. ARM., Ganguly. KK. and Nower. N (۲۰۲۱) “Adaptive traffic ...
  • Krajzewicz, D., Erdmann, J., Behrisch, M. and Bieker, L. (۲۰۱۲) ...
  • Li, L., Lv, Y. and Wang, F.Y. (۲۰۱۶) “Traffic signal ...
  • Li, M., Li, Z., Xu, C. and Liu, T. (۲۰۲۰) ...
  • Liang, X., Du, X., Wang, G. and Han, Z. (۲۰۱۸) ...
  • Liang, X., Du, X., Wang, G and Han, Z. (۲۰۱۹) ...
  • Maurya, A.K., Dey, S. and Das, S. (۲۰۱۵) “Speed and ...
  • Mousavi, S.S., Schukat M. and Howley, E. (۲۰۱۷) “Traffic light ...
  • Paul, A. and Mitra, S. (۲۰۲۲) “Exploring reward efficacy in ...
  • Rodrigues, F. and Azevedo, C.L. (۲۰۱۹) “Towards robust deep reinforcement ...
  • Sutton, R.S.and Barto, A.G. (۲۰۱۸) “Reinforcement learning: An introduction”. MIT ...
  • Van der Pol, E., Oliehoek, F.A. (۲۰۱۶) “Coordinated deep reinforcement ...
  • Vidali, A., Crociani, L., Vizzari, G. and Bandini, S. (۲۰۱۹) ...
  • Wang. T., Cao. J. and. Hussain A (۲۰۲۱) “Adaptive Traffic ...
  • Wei. H., Zheng, G., Gayah, V. and Li, Z. (۲۰۲۱) ...
  • Wei, H., Zheng, G., Yao, H. and Li, Z. (۲۰۱۸) ...
  • Yoon, J., Ahn, K., Park, J and Yeo, H. (۲۰۲۱) ...
  • Roy, A., Hossain, M. and Muromachi, Y. (۲۰۲۲) “A deep ...
  • Zheng, G., Zang, X., Xu, N., Wei, H., Yu, Z., ...
  • نمایش کامل مراجع