本發明公開了一種強化學習多智能體溝通與決策方法,包括:根據各個智能體的觀測狀態信息通過神經網絡提取相應的狀態特征;將所有智能體的狀態特征作為溝通信息輸入至VLAD層中進行軟分配與聚類,得到聚類后的溝通信息;將聚類后的溝通信息分發給各個智能體,由各個智能體將自身的狀態特征與接收到的聚類后的溝通信息進行聚合,并通過智能體內部的全連接神經網絡進行動作決策。該方法可以對各智能體的狀態信息進行聚類并與其他智能體進行溝通,進而提高智能體的決策水平。
聲明:
“強化學習多智能體溝通與決策方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)