本發明公開了一種聯合LSTM和深度強化學習的家庭能源管理方法及介質,屬于智能電網需求響應領域,方法包括:利用LSTM網絡預測下一時間段的光伏發電量信息和電價信息,并作為下一時間段馬爾可夫決策過程的狀態空間信息;根據家庭住宅中各類電氣負荷對應電氣設備的工作參數以及狀態空間信息,將實時需求響應調度問題轉化為狀態轉移概率未知的馬爾可夫決策過程,得到MDP模型;設計基于深度神經網絡的隨機策略,以獲得價值網絡和策略網絡;基于MDP模型,利用近端策略優化算法對價值網絡和策略網絡進行訓練,并利用訓練后的策略網絡輸出最優動作策略,根據最優動作策略管理各電氣設備。實現最小化家庭用能成本和保證用戶舒適度的目標。
聲明:
“聯合LSTM和深度強化學習的家庭能源管理方法及介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)