本發明提供了一種基于強化學習和圖注意力網絡的交通信號控制方法及系統,包括:初始化步驟:定義交通信號控制問題中各個變量,初始化交通信號算法模型;觀測信息向量化步驟:通過多層感知機將觀測信息向量降維,得到降維后的數據hi;圖注意力機制構建步驟:利用降維后的數據hi,從注意力機制出發,構建適用于交通信號算法模型的注意力機制hmi;損失函數構建步驟:根據注意力機制hmi,計算損失函數;行為更新步驟:根據構建的交通信號算法模型中獎勵函數,對損失函數進行迭代計算,以獲得最終交通信號算法模型;預測結果計算步驟:根據構建的最終交通信號算法模型計算交通信號的控制策略π,實現信號控制;本發明適用于大規模復雜的交通道路情況。
聲明:
“基于強化學習和圖注意力網絡的交通信號控制方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)