本發明涉及一種基于強化學習的空間機器人捕獲翻滾目標運動規劃方法,包括設計了用以學習訓練的智能體狀態與動作具體形式,與到達任務的獎勵函數;基于優先回放的DDPG算法改進;應用改進的DDPG算法進行抓捕任務的訓練過程。本發明的有益效果是,不再需要對空間機器人與非合作環境進行精確建模,僅在觀測特定狀態的情況下進行智能算法的學習訓練,即可對空間機器人抓捕非合作目標進行運動規劃。其學習到的策略可以應對一定程度的觀測噪聲,使得機器人可以智能、自主地抓捕目標。
聲明:
“基于強化學習的空間機器人捕獲翻滾目標運動規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)