本發明提供了一種基于Q學習的室內測量機器人多目標點移動路徑規劃方法,基于強化學習中一種與模型無關的Q學習算法,在回報函數中設定符合測量機器人的移動策略用于機器人實踐學習,利用狀態、動作、獎勵這三個要素,根據測量機器人當前所處狀態來采取行動,并記錄被反饋的獎勵,決策到下個狀態時能采取的更優動作,從而實現在測量點數量和位置已知的情況下,測量機器人自動獲取一條順序合理的移動路徑。本發明提出的移動路徑規劃方法能夠實現測量機器人在室內環境中多測量點的全局移動規劃,幫助測量機器人在進行測量任務過程中“不走冤枉路”,以最快的速度完成工作,大大提高了測量效率。
聲明:
“基于Q學習的室內測量機器人多目標點移動路徑規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)