本發明涉及一種面向自動駕駛的基于深度強化學習的端到端導航避障方法,采用激光雷達,對激光雷達點云進行采樣,生成環境一維激光點云,并通過代價地圖轉換算法進行轉換,得到表示環境動態靜態障礙物的障礙物地圖;通過與仿真環境進行閉環交互,收集環境障礙物地圖,從而生成導航環境數據集;構建異構智能體自我博弈避障模型,異構多智能體自我博弈模型包括:觀測空間、動作空間、獎勵函數和神經網絡;進行多階段并行課程學習,以使神經網絡更快更好的達到局部最優解,同時加速學習過程,最終得到訓練后的異構智能體自我博弈避障模型;將訓練好的異構智能體自我博弈避障模型部署到實際車輛上,在現實世界中實現導航和避障。
聲明:
“面向自動駕駛的基于深度強化學習的端到端導航避障方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)