本發明涉及一種基于深度強化學習A3C算法的HEV能量管理方法,屬于新能源汽車領域。該方法包括:S1:根據工況的特征參數劃分車輛行駛標準工況;S2:計算整車的需求功率;S3:確定需要的狀態變量、動作變量以及獎勵函數;S4:建立A3C算法模型,設定環境?智能體模塊;S5:根據電池SOC以及需求功率的大小,設計并加入基于規則的發動機啟停策略;S6:環境?智能體模塊中分別加載不同類型的標準工況,通過不斷迭代試錯的學習方式訓練算法模型中的深度神經網絡,當總獎勵處于穩定收斂狀態后結束訓練過程,并且保存全局神經網絡的持久化模型。本發明在保證燃油經濟性的條件下實現對所有隨機工況的自適應能力。
聲明:
“基于深度強化學習A3C算法的HEV能量管理方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)