本發明涉及新能源汽車制動領域,具體涉及一種基于DDPG深度強化學習的AEB控制方法及系統,包括構建基于策略網絡和值網絡構建動作?評價網絡,根據策略網絡選擇在當前行駛狀態下的動作,值網絡對選擇的動作進行評價;構建基于目標策略網絡和目標值網絡的目標網絡,使用經驗回放機制從樣本值中隨機獲取訓練樣本對策略網絡和值網絡進行離線訓練和更新;目標網絡根據在當前行駛狀態下執行動作?評價網絡選擇的動作后狀態的評價值和系統的獎勵函數更新策略網絡;將當前行駛狀態輸入,通過基于策略網絡和值網絡構建動作?評價網絡選擇最優的動作;本發明采用優化后的制動策略能夠提高新能源汽車的經濟效益,降低無效油耗,減緩車輛零件老化速度。
聲明:
“基于DDPG深度強化學習的AEB控制方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)