本發明公開了基于日內多目標強化學習的梯級電站離線調度方法及系統,涉及電力系統調度技術領域,其技術方案要點是:根據日內調度場景對調度任務進行劃分,得到戰略任務以及兼顧任務;利用貝葉斯回歸模型從日內調度的決策因子中預測未來來水和電力需求的概率分布;根據戰略任務、兼顧任務和決策因子構建梯級電站調度的調度仿真系統;根據日內調度場景確定多目標的標準化回報函數,并將標準化回報函數加入調度仿真系統以實現對調度策略進行評價;根據調度策略的評價結果在調度仿真系統中訓練調度策略,得到離線的調度優化模型;進行效果驗證。本發明使得梯級電站的調度策略生成過程準確度較高,整體實現的可靠性較強。
聲明:
“基于日內多目標強化學習的梯級電站離線調度方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)