本發明提供了一種基于深度強化學習的連續交叉口信號協同控制方法,該方法采用上下層Agent網絡的DQN策略處理連續交叉口信號配時,以減少狀態獲取及反饋評價的復雜度,解決連續交叉口信號優化問題。為保證訓練目標的平穩性,避免其訓練陷入目標值與預測值的反饋循環中震蕩發散,采用Dueling Double優化方法對DQN優化訓練,相比于傳統DQN控制模型,該方法可根據不同道路環境和交通狀態實時切換交叉口相位,增加了交叉口之間的協作能力,保障交叉口行車暢通,提高交叉口通行能力,為緩解交通擁堵、提高出行效率并減少安全事故提出了新的解決方案和理論依據。
聲明:
“基于深度強化學習的連續交叉口信號協同控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)