本發明涉及一種基于深度確定性策略算法的發電機組啟停配置方法及系統,該方法將機組組合啟停分配問題構造成為強化學習序列決策問題,所述的方法包括以下步驟:1)將前一歷史時刻各機組出力值向量作為智能體觀測狀態,用以作為深度策略網絡的輸入向量;2)針對連續時間序列機組啟停優化問題,使用深度確定性策略梯度算法給出優化決策序列,輸出機組在該時刻的啟停向量,實現對機組啟停狀態的分配。與現有技術相比,本發明采用深度確定性策略學習方法,直接得到不同時刻的啟停向量,能夠適應不同規模機組集群啟停表的自動分配,使得系統具有較好的擴展性。
聲明:
“基于深度確定性策略算法的發電機組啟停配置方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)