一種基于強化學習的AUV行為規劃及動作控制方法,屬于水下機器人技術領域。為了解決AUV規劃復雜任務時過于依靠人工經驗,以及基于智能算法設計的控制方法需要精確的環境模型,從而導致訓練經驗局限,在現實環境中應用困難的問題。本發明將AUV探測隧洞定義為總任務;完成任務對應的行為包括:趨向目標、墻壁跟蹤和避障;將機器人在水下需要完成所規劃的行為而產生的控制指令定義為動作;AUV在執行隧洞探測任務時,使用深度強化學習DQN算法進行實時行為規劃,構建對應的深度學習的行為網絡,完成隧洞探測任務的規劃。通過DDPG方法訓練AUV的動作網絡,將AUV視為環境模型,得到力到狀態的映射,從而實現AUV的動作控制。
聲明:
“基于強化學習的AUV行為規劃及動作控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)