本公開提供了一種路徑規劃模型的訓練方法和路徑規劃方法、裝置、設備、介質,涉及人工智能領域,具體涉及深度學習和計算機視覺領域,可應用于自動駕駛和機械生產等場景。訓練方法的具體實現方案包括:采用編碼網絡對第一樣本數據中的第一環境數據進行編碼,獲得第一環境數據的第一特征數據,該第一樣本數據還包括第一實際路徑數據;將第一特征數據輸入深度強化學習網絡,得到針對第一環境數據的預測路徑數據;基于第一實際路徑數據和針對第一環境數據的預測路徑數據,對編碼網絡和深度強化學習網絡進行訓練。其中,編碼網絡是采用第二樣本數據預訓練得到的,第二樣本數據包括第一樣本數據所屬的目標領域的數據及除目標領域外其他領域的數據。
聲明:
“路徑規劃模型的訓練方法和路徑規劃方法、裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)