本發明涉及一種基于強化學習的交通流多步預測方法,包括以下步驟:首先對原始交通數據進行篩選和統計,得到特定路段的速度數據以及該路段兩端交叉口的流量數據。緊接著對這些數據進行預處理,包括補齊缺失數據、處理錯誤數據和數據歸一化;然后建立基于DDPG結構的交通流多步預測模型,確定模型中強化學習三要素在交通流多步預測任務下的對應內容,確定交通流多步預測任務中智能體與環境的交互內容。最后,使用預處理好的數據訓練所建立的交通流多步預測模型,并調整模型中的參數以獲得最優的交通流多步預測效果。實驗結果驗證了模型在交通流多步預測任務上的有效性,并為使用強化學習解決多步預測任務提供新的思路和方法。
聲明:
“基于強化學習的交通流多步預測方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)