本發明屬于多智能體系統的強化學習領域,具體涉及了一種基于動態圖神經網絡的多智能體對抗方法及系統,旨在解決現有基于圖神經網絡的多智能體模型訓練速度慢、效率低以及圖構建中需要較多人工干預的問題。本發明包括:獲取每一個智能體的觀測向量,并進行線性變換獲得觀測特征向量;計算相鄰智能體之間的連接關系,構建智能體之間的圖結構;結合觀測特征向量對智能體之間的圖結構進行嵌入表示;將嵌入表示用于動作網絡的動作預測結果和評價網絡的評價,進行網絡時空并行訓練;通過訓練好的網絡進行多智能體對抗中的動作預測和動作評價。本發明通過剪枝建立更真實的圖關系,利用全連接神經網絡加位置編碼的實現時空并行訓練,訓練效率高、效果好。
聲明:
“基于動態圖神經網絡的多智能體對抗方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)