本發明提供一種基于深度強化學習的動態AUV追蹤路徑規劃方法,通過引入深度強化學習算法,運用航路模型來處理AUV的路徑追蹤問題。首先對目標和AUV狀態分析,判斷并選擇采用哪種航路進行追蹤,建立三種航路模型,用訓練好的模型對AUV下一狀態進行預測。采用純方位最小二乘估計法對檢測到的目標信號進行運動要素解算,獲得目標信息。將目標和AUV運動情況作為狀態輸入,AUV下一狀態的動作和航向作為輸出,建立狀態——動作映射策略。根據任務要求,選擇獎賞函數,AUV每段時間所采取的決策都會獲得相應評價。本發明結合深度學習和強化學習的優點,將深度強化學習算法用在AUV路徑追蹤上,實現了對動態AUV的追蹤路徑規劃。
聲明:
“基于深度強化學習的動態AUV追蹤路徑規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)