本發明公開一種基于強化學習的線性系統數據驅動模型預測控制方法,能夠保證控制算法的穩定性,避免模型預測控制中復雜的終端約束、終端集、終端代價設計等。包括:在開環狀態下,對線性系統施加隨機的輸入,并測量線性系統的輸出,收集N組輸入?輸出軌跡,分別構建漢克爾矩陣;在采樣時刻k,利用線性系統的歷史軌跡求解所述漢克爾矩陣優化問題,預測得到線性系統未來的輸入、輸出和最小化目標函數;根據所述最小目標函數利用強化學習方法迭代更新權重直到終端代價函數收斂;將預測得到的最優控制輸入中的第一個元素作為輸入作用于系統,并觀測系統輸出,循環直到系統穩定。
聲明:
“基于強化學習的線性系統數據驅動模型預測控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)