本發明公開了一種無人車強化學習訓練環境構建方法及其訓練系統,屬于機器人導航領域與機器人仿真平臺領域。包括:構建真實場景與仿真場景數據集;數據集增強;圖像域轉換算法的訓練與模型保存;建立仿真環境模型與強化學習算法的API接口。在仿真環境中訓練時,無人車模型上的攝像頭采集觀測到的仿真環境圖像,經過圖像域轉換網絡,轉變為模擬的真實場景圖片,作為狀態輸入強化學習網絡,經過決策輸出動作指令,發布給仿真端的無人車模型。在實際應用時,無人車攝像頭采集現實中的真實場景圖片,由于強化學習算法在訓練時的輸入的模擬真實場景圖片與現實真實場景圖片非常相似,因此訓練好的算法可以直接遷移或者微調之后遷移至真實場景當中。
聲明:
“無人車強化學習訓練環境構建方法及其訓練系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)