本發明公開一種運動學約束條件下基于深度強化學習的UAV路徑規劃方法,具體步驟如下:S1:深度強化學習神經網絡根據多個任務點以及靜態障礙物的向量坐標得出最短路徑;S2:無人機起飛后沿著最短路徑飛行執行任務;S3:當探測到存在動態障礙物,無人機向基地發送信號,由超級計算機預測無人機接收信號時所在的位置;S4:根據動態障礙物以及剩余任務點的坐標使用深度強化學習神經網絡輸出得到新的飛行路徑,并通過無線電將新的路徑發送給無人機;S5:無人機沿著新的路徑執行任務,執行完所有任務后最終返回基地。本發明提出了一種基于online和offline的框架,不僅解決了Q?Learning中狀態和動作都是高維的問題,而且在解決TSP問題的同時考慮運動學模型并避開動態障礙物。
聲明:
“運動學約束條件下基于深度強化學習的UAV路徑規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)