本發明公開了一種基于深度強化學習的移動機器人避障方法,通過激光雷達獲取點云數據,對點云數據進行卷積特征提取,與行人位置、行人速度、全局路徑共同作為神經網絡輸入,建立全連接神經網絡,設定環境獎勵,通過PPO深度強化學習算法輸出機器人動作。相對于其他規劃或學習的導航方法,本方法無需對行人進行預測、傳感器預處理、簡化了算法復雜度,更加適用于在多人環境下的機器人導航策略。同時由于加入全局路徑作為輸入量,提升了算法的適用范圍,同時也加快了算法的收斂時間。
聲明:
“基于深度強化學習的移動機器人避障方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)