本發明涉及一種基于強化學習的變電站內巡檢機器人路徑規劃方案,該方案針對變電站巡檢場景,在獲取實際變電站環境信息之后,通過柵格法建立變電站環境模型,并采用SARSA算法設計巡檢機器人路徑規劃方案,以貪婪策略代替Q?learning中的貪婪策略,通過更為保守的路徑規劃,減少巡檢機器人與障礙物發生碰撞的概率,大大延長其使用壽命。此外,通過對SARSA算法中獎賞的設計,減少機器人到達同一個巡檢點位的次數,保證機器人快速高效地完成巡檢任務。與現有技術相比,本發明能夠實現以巡檢機器人為主體的自主路徑選擇與安全避障,達到性能的快速高效收斂,對場景的適應能力更強,業務性能更優。
聲明:
“基于強化學習的變電站內巡檢機器人路徑規劃方案” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)