本發明公開了基于深度強化學習的車道保持方法,包括采集環境?智能體狀態觀測值,即環境狀態數據和車輛狀態數據并進行數據的預處理后用以傳入網絡模型和初始化網絡。網絡基于交互數據以強化學習的方式學習車道保持這一駕駛任務,期間不斷更新網絡直至模型收斂,然后基于收斂后的網絡進行任務執行的最優策略輸出控制。本發明提供的基于深度強化學習的車道保持方法,實現了小車車道保持任務的自學習,簡化了傳統的車道檢測?處理?控制流程,實現了端到端的命令輸出控制。
聲明:
“基于深度強化學習的車道保持方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)