本發明公開了一種基于強化學習與動態配時的交通信號燈控制系統及方法,首先對十字路口進行建模,分別定義強化學習三要素state,reward,action;然后依據強化學習A2C算法構建策略網絡和評估網絡;最后收集路口實時信息,轉化為state向量后輸入到構建的策略網絡和評估網絡,輸出action概率分布,系統根據action概率分布選擇最合適的相位;決定相位后,接下來的一段時間就屬于該相位的綠燈時間;由自適應定時控制器構成的動態配時模塊根據實時的交通流信息,以最大化綠燈時間利用為目標,動態控制綠燈時間;當檢測到綠燈時間的損失,就終止當前相位。本發明克服了固定分配交通燈時長而導致綠燈利用率不高的缺陷,減少了車輛的平均等待時間和二氧化碳等有害氣體的排放。
聲明:
“基于強化學習與動態配時的交通信號燈控制系統及方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)