本發明涉及一種基于強化學習的自適應新能源超短期功率預測方法及裝置,所述方法包括獲取用于構建自適應智能體的環境變量、動作空間及獎勵函數;其中,環境變量為反映環境特點的環境變量指標,動作空間為智能體決策采取的動作函數集合,獎勵函數為智能體在動作執行后,環境變量相應變化的評價結果;根據所述環境變量、和獎勵函數構建自適應智能體;對環境變量進行處理,利用處理后的環境變量對自適應智能體進行訓練,得到自適應預測智能體。本發明將根據環境變量自適應選取與外部環境最契合的單一類預測方法預測結果,從而最大限度提升預測結果準確率。本申請提供的方法實施流程簡單,具有較強的應用前景。
聲明:
“基于強化學習的自適應新能源超短期功率預測方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)