本發明公開了一種基于多智能體強化學習的多無人機協同空戰機動決策方法,解決了仿真多對多空戰中多無人機協同空戰中的機動動作的自主決策問題。本方法包含:無人機平臺的運動模型創建;基于攻擊區和距離、角度因素的多機空戰態勢評估,分析多機空戰機動決策的狀態空間、行動空間和獎勵值;設計了協同空戰中的目標分配方法和策略協調機制,通過獎勵值的分配,定義了各個無人機在目標分配、態勢優勢和安全避碰的行為反饋,經過訓練后實現策略協同。本發明可有效提高多無人機進行協同空戰機動自主決策的能力,具有更強的協同性和自主尋優性,在不斷的仿真和學習中無人機編隊所做的決策水平不斷提高。
聲明:
“基于多智能體強化學習的多無人機協同空戰機動決策方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)