本發明公開了一種自動駕駛決策方法、裝置、車輛及存儲介質。其中,該方法包括:采集目標車輛的行車環境數據,行車環境數據包括目標車輛的車輛數據和障礙物數據;利用深度神經網絡模型對行車環境數據進行分析,得到決策動作,其中,深度神經網絡模型基于回報函數和深度強化學習算法構建并訓練,回報函數用于根據目標車輛至少兩個時刻的行車速度和行車位移對深度神經網絡模型進行訓練;控制目標車輛執行決策動作。本發明解決了決策模型中的回報函數設計不合理,進而導致模型輸出的決策結果不夠合理的技術問題。
聲明:
“自動駕駛決策方法、裝置、車輛及存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)