本發明提供一種多路口交通信號燈控制方法、裝置、電子設備及存儲介質,采用的本地共享模型在訓練時并不需要其他路口的訓練樣本,而是以聯邦強化學習算法,借助于初始本地私有模型以及中央處理器智能體中與初始本地共享模型結構相同的初始全局模型進行集中?分布式協同訓練得到,可以保證各路口的時序交通狀態信息觀測樣本的隱私性,即使不共享的情況下也可以得到準確的本地共享模型,避免了數據孤島問題的出現。而且,由于采用基于聯邦強化學習算法的集中?分布式協同訓練的方式,可以避免出現現有技術中對強化學習智能體訓練時探索空間會呈現指數級增長的問題出現,可以實現最優化全局道路網絡的交通狀況。
聲明:
“多路口交通信號燈控制方法、裝置、電子設備及存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)