本發明公開了一種基于深度強化學習的服務機器人行人感知避障方法,涉及深度學習和服務機器人避障領域。該方法在訓練階段:首先,使用ORCA算法生成訓練數據。然后,隨機生成實驗場景,使用初始化后的強化學習模型與環境交互生成新的訓練數據,并融合進原有訓練數據。最后,在新的訓練數據上利用SGD算法訓練網絡,得到最終的網絡模型。該方法在執行階段:通過激光雷達獲取周圍行人的狀態,根據訓練好的模型和獎勵函數計算預測狀態,選擇獲得最大獎勵的動作作為輸出并執行。本發明具有很強的實時性和適應性,在行人環境下,可以使機器人遵守行人的右行規則,規劃出高效、安全、自然的路徑,提升了服務機器人的智能性和社交性。
聲明:
“基于深度強化學習的服務機器人行人感知避障方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)