本發明屬于無人駕駛技術領域,公開了一種速差滑移轉向車輛的目標跟隨及動態障礙物避障控制方法,利用強化學習中的深度確定性策略建立四個神經網絡;構建障礙物的代價范圍從而確定動作的單步獎勵函數;通過actor?critic策略確定連續動作輸出,并利用梯度傳遞不斷更新網絡參數;訓練出根據當前狀態進行跟隨和避障的網絡模型。本發明提升了車輛跟隨及避障的智能性,能夠更好的適應未知環境并很好的應對其他突發情況。減小了強化學習訓練過程中建立仿真環境的復雜度。利用提前訓練好的神經網絡預測模型,由目標和障礙物的初始位置姿態及每步動作值能得到目標車輛和障礙物的每一步的位置姿態,提高了仿真的準確率和效率。
聲明:
“速差滑移轉向車輛的目標跟隨及動態障礙物避障控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)