本發明公開了一種基于DDPG和迭代控制的自動駕駛車輛側傾控制方法,在不同場景下的自動駕駛車輛行駛地圖訓練DDPG算法,自動駕駛車輛通過與不同場景下的地圖環境交互,產生實時的車輛狀態,確定車輛的動作行為;在進行動作訓練時,對動作空間進行初始化,演員網絡中的online策略網絡產生狀態空間信息,進行動作輸出,并增加一個動作噪聲來獲取具有探索性的動作空間;基于LSTM歷史記憶和道路規劃屬性,生成自動駕駛車輛狀態預測的路徑,采用DDPG算法實現自動駕駛車輛正常行駛工況下和極端行駛工況下路徑軌跡的跟蹤控制,并采用迭代控制方法實現自動駕駛車輛補償控制。本發明避免了車輛在極端道路環境行駛條件下,強化學習算法的不穩定性問題的發生,提升了車輛的行駛安全性和魯棒性。
聲明:
“基于DDPG和迭代控制的自動駕駛車輛側傾控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)