本發明提供一種基于近似動態規劃算法的一次調頻附加學習控制方法,所述方法包括如下步驟:I、訓練樣本數據的收集;II、附加學習控制器的近似計算;III、附加學習控制器的優化迭代。本發明的優點在于給出了一種近似動態規劃的一次調頻在線學習附加學習控制方法,該方法可以檢測控制器的輸入和輸出,包含強化學習的值函數迭代策略,能在系統運行過程中,根據系統的反饋在線對機組功率輸出進行進一步的優化調整。該控制器作為附加學習控制,不需要替代原有的機組控制器,還可以利用系統原有控制器先驗知識進行強化學習,提高收斂速度,并在此基礎上考慮到了儲能的優化運行區間。
聲明:
“基于近似動態規劃算法的一次調頻附加學習控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)