本發明公開了一種基于深度增強學習的預觀控制仿人機器人步態規劃方法,包括步驟:1)通過裝配在仿人機器人上的傳感器獲取狀態信息;2)改進現有的深度強化學習網絡,定義全新的狀態、動作向量和獎勵函數;3)使用定義的動作向量對預觀控制器的輸出進行修正,計算出仿人機器人雙腿各舵機的角度,指導仿人機器人行走;4)在仿人機器人行走過程中,用狀態、動作向量、獎勵函數的值更新改進的深度強化學習網絡。本發明方法可有效解決仿人機器人在復雜環境下的行走問題,且在仿真平臺和實體機器人上進行了測試,驗證了此方法的有效性。
聲明:
“基于深度增強學習的預觀控制仿人機器人步態規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)