本發明公開了一種基于時間分配和強化學習的交通信號燈控制方法,包括:(1)配置仿真路口環境以及車流數據到交通模擬器,搭建智能體網絡;(2)智能體網絡根據路況狀態產生下一信號周期的動作,并交由交通模擬器仿真一個信號周期;(3)把上一信號周期的經驗存到重演緩存;(4)從重演緩存中采樣經驗訓練智能體網絡,并判斷仿真的步數是否達到預設值,如果沒有達到,則返回步驟(2),否則執行下一步;(5)重置交通模擬器并對智能體網絡進行測試,完成測試后進行交通信號燈控制的應用。利用本發明,可以顯著提升交通效率,能更容易地應用到實際道路上。
聲明:
“基于時間分配和強化學習的交通信號燈控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)