本發明公開基于雙?深度期望Q?學習網絡算法的電網能量管理方法及系統,首先基于貝葉斯神經網絡對預測點光伏出力不確定性建模并獲得光伏出力的概率分布;將光伏出力的概率分布輸入基于雙?深度期望Q?學習網絡算法的電網能量管理模型中得到相應的光伏發電出力策略;系統依據光伏發電出力策略運行各光伏出力設備運用;本發明將微電網經濟調度問題模擬為馬爾可夫決策過程,將目標函數和約束條件映射成強化學習的獎懲函數,利用其學習和與環境交互的能力獲得最優決策,借助貝葉斯神經網絡對學習環境中光伏發電出力的不確定性建模在馬爾科夫決策過程中適當考慮狀態隨機轉移,顯著提高算法的收斂速度。
聲明:
“基于深度期望Q-學習的電網能量管理方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)