本發明提出一種基于強化學習的神經網絡逆控制器進行控制的方法,神經網絡控制包含神經網絡逆控制器和神經網絡模型兩部分,神經網絡模型主要用于對被控制對象進行辨識,并向神經網絡逆控制器提供被控制對象信息。神經網絡逆控制器采用強化學習中的行動者?評論家結構,行動者采用神經網絡根據評論家提供的值函數學習控制策略,依據策略函數給出下一步控制增量,評論家采用神經網絡建立狀態、行動與值函數的擬合關系,值函數根據預測控制中的性能評價函數設置,能有效解決控制系統的遲延問題。本發明的方法能夠適應時滯系統的控制要求,能根據被控參數未來的趨勢使執行機構提早動作,抑制被控量的波動,同時能適應被控對象時變和非線性的特性,提高控制品質和穩定性。
聲明:
“基于強化學習的神經網絡逆控制器進行控制的方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)