本發明公開了一種基于多智能體強化學習和雙層策略分配的多區域熱電協調控制方法,包括:建立多區域熱電聯合系統數字孿生模型;創建多個區域智能體,并建立多個區域智能體間的通信機制;設計基于多智能體均衡學習算法的多區域均衡控制器,包括獎勵函數、均衡選擇函數和資格跡的選??;通過多區域均衡控制器對各個區域進行狀態估計、更新資格跡、獎勵值觀測和更新狀態?動作值函數操作后,再進行多個區域部分信息的交互,在線尋求各區域最優均衡總控制策略;將區域熱電聯合系統中每臺機組作為一個機組智能體,以各機組的爬升時間作為一致性變量,采用一致性算法將各區域總控制策略分配給各個機組,實現區域內各機組之間的協調控制。
聲明:
“多智能體強化學習和雙層策略分配的多區域熱電協調控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)