本發明是一種基于深度強化學習的無人系統集群控制方法。本發明涉及無人系統集群控制技術領域,本發明為了解決現有無人系統集群控制方法環境適應性差的問題。本發明包括:在無人系統集群中,每個無人系統分別探測環境信息;將環境信息分為目標信息、障礙信息以及其他無人系統狀態信息;對獲得的信息分別進行標準化處理;將標準化處理的信息通過深度神經網絡處理,得到選擇動作的概率值;根據得到的概率值選擇動作,觀測新的環境信息并獲得動作評價值;收集所有無人系統與環境交互的數據訓練深度神經網絡;利用訓練好的深度神經網絡進行無人系統集群控制。本發明用于無人系統集群控制技術領域。
聲明:
“基于深度強化學習的無人系統集群控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)