本發明公開了一種結合路徑規劃和強化學習的導航避障控制方法、系統及模型,將駕駛任務分為靜態的路徑規劃和動態的最優軌跡跟蹤,實現基于規則的路徑規劃算法與深度強化學習的結合,可以有效地解決復雜道路場景(如無信號燈路口左轉)下的車輛控制難的問題。本發明與現有的PID+LQR控制策略相比,不需要人為地對參數進行不斷調整。與模型預測控制(MPC)控制方法相比,不過分依賴被控對象的模型精度,同時求解過程的復雜性大大降低,提高了車載的實時計算效率。本發明與端到端的強化學習相比,結合了車輛的運動學模型,具有可解釋性,同時也大大提高了車輛導航過程中的安全性。
聲明:
“結合路徑規劃和強化學習的導航避障控制方法、系統及模型” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)