基于在線增強學習模型的全流程任務時序智能決策方法,第一步,針對紅藍方對抗推演場景,建立增強學習模型,實現面向場景信息的任務時序決策;第二步,采用在線學習異步訓練方法對增強學習模型進行強化學習訓練,提升訓練的魯棒性和穩定性;第三步,以紅方的全流程任務完成概率為基準,通過融合不同的探測與識別弧段得到全局任務完成概率,作為反饋信息;第四步,以全局任務完成概率作為反饋,完成增強學習模型在功能級干擾對抗決策上的訓練和部署。本發明解決了現有技術中存在的紅藍方推演全流程任務時序決策效率低、泛化性差等問題。
聲明:
“基于在線增強學習模型的全流程任務時序智能決策方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)