本發(fā)明公布了一種數據驅動(dòng)的多智能體系統PID控制協(xié)議自學(xué)習方法,本發(fā)明針對PID控制的多智能體系統,提出最優(yōu)一致性問(wèn)題;將求解基于PID控制的控制協(xié)議參數轉化為求解一個(gè)非零和博弈問(wèn)題,提出了一種非策略Q學(xué)習算法,實(shí)現PID控制協(xié)議參數在線(xiàn)自學(xué)習以及多智能體系統的最優(yōu)一致性;將強化學(xué)習(RL)技術(shù)和神經(jīng)網(wǎng)絡(luò )函數估計方法相結合,不要求智能體系統動(dòng)態(tài)已知,完全利用可測量數據自學(xué)習PID控制協(xié)議參數。本發(fā)明方法不需要知道多智能體系統的動(dòng)力學(xué)模型,就能使所有智能體達到一致?tīng)顟B(tài),即達到一致性,同時(shí)能保證多智能體規定性能的最優(yōu)性。
聲明:
“數據驅動(dòng)的多智能體系統PID控制協(xié)議自學(xué)習方法” 該技術(shù)專(zhuān)利(論文)所有權利歸屬于技術(shù)(論文)所有人。僅供學(xué)習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)