本發明涉及一種基于強化學習的交通彈性調控方法及系統。該方法包括:將交通網絡劃分為若干區域,并采集每個區域的車流信息;根據車流信息確定每個區域的宏觀基本圖;基于宏觀基本圖,確定各個區域供需平衡時的流量水平;根據流量水平確定交通網絡的失衡率;根據失衡率,通過滲流分析確定交通網絡的臨界失衡閾值;建立多智能體強化學習模型,并根據車流信息、流量水平以及臨界失衡閾值對多智能體強化學習模型進行學習訓練,生成訓練后的多智能體強化學習模型;利用訓練后的多智能體強化學習模型調控實際交通網絡,使得實際交通網絡的當前失衡率小于所述臨界失衡閾值。本發明能夠在最短調控周期下達到最佳調控效果。
聲明:
“基于強化學習的交通彈性調控方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)