本發明提出了一種基于擬合強化學習的空戰行為建模方法,解決了虛擬空戰仿真中戰術動作的智能決策問題。本方法包含:對飛機作戰過程的軌跡進行采樣;在狀態空間中對效用函數進行擬合,通過貝爾曼迭代和最小二乘法擬合對效用函數進行近似計算;作戰決策,通過前瞻測試,在預測過程中采用所擬合的效用函數進行動作決策,根據預測的執行結果確定最終執行的動作。本發明方法可有效提高效用函數的擬合效率以及獲取效率,相對傳統方法,本發明方法能更快地獲取最優行動策略。
聲明:
“基于擬合強化學習的空戰行為建模方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)