本發明公開了一種電網運行環境模擬方法、系統、設備及介質,所述模擬方法包括以下步驟:獲取當前時刻觀測狀態;生成當前時刻動作空間;獲取外部輸入的動作指令,根據當前時刻動作空間判定動作指令的合法性,若不合法則終止,若合法則基于動作指令和當前時刻觀測狀態進行潮流計算,獲得下一時刻電網運行狀態;獲得符合預設約束規則的電網運行狀態;獲取下一時刻觀測狀態;基于下一時刻觀測狀態和所述外部輸入的動作指令獲得獎勵值,完成基于強化學習的電網運行環境模擬。本發明提供的方法能夠模擬電網運行環境,可以支撐采用強化學習實現電網調度。
聲明:
“電網運行環境模擬方法、系統、設備及介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)