本發明公開一種基于近端策略優化的用戶實時自治能量管理優化方法,管理優化方法包括S1:對用戶DER設備進行分類和建模;S2:基于S1中對用戶DER設備的分類及建模,將用戶實時自治能量管理優化問題建模為序貫決策問題;S3:利用長短期記憶神經網絡提取實時的時序數據的未來走勢,輔助步驟S4和S5中深度強化學習進行策略優化;S4:將S3中提取的未來走勢和能量管理智能體觀測的內部狀態特征輸入到基于深度神經網絡的策略函數,賦能能量管理智能同時學習離散與連續動作,實現對各設備的控制;S5:采用基于近端策略優化算法賦能在S4中的離散與連續動作中學習能量管理優化策略。本發明管理優化方法最小化用電成本的同時提升策略對不確定性的適應性。
聲明:
“基于近端策略優化的用戶實時自治能量管理優化方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)