本申請公開了一種多智能體信息融合方法、裝置、電子設備及可讀存儲介質。其中,方法包括構建操作預測網絡模型和門控注意力機制模型,門控注意力機制模型根據不同來源信息以交互過程中學習的比例進行融合,且各智能體基于自身數據和通信信息融合結果共同確定是否接收通信信息融合結果。將多智能體應用模擬環境的狀態信息輸入至操作預測網絡模型,得到各智能體的預測動作;根據多智能體應用模擬環境基于各智能體的預測動作信息輸出的各預測動作得分和下一時刻的狀態信息、每個智能體的價值評估信息,基于門控注意力機制模型的強化學習算法更新操作預測網絡模型,循環訓練操作預測網絡模型直至收斂。本申請提升了多智能體信息融合效果。
聲明:
“多智能體信息融合方法、裝置、電子設備及可讀存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)