本發明涉及一種基于深度強化學習的擬人化自動駕駛跟馳模型,應用于自動駕駛跟馳控制領域?;谏虾W匀获{駛實驗數據,將選取的快速路跟馳數據集分為訓練數據和驗證數據。使用深度確定性策略梯度(DDPG)深度強化學習方法,通過構建仿真環境以使強化學習(RL)智能體通過一系列狀態、行動和獎勵值與環境交互,選取評價指標,設置獎勵函數,選擇神經網絡結構,設置神經網絡更新策略及超參數,設置探索策略,構建深度強化學習的擬人化跟馳模型。通過訓練并測試模型,進一步優化模型。本發明模型在軌跡復現和泛化能力方面超越了傳統跟馳模型和近期數據驅動跟馳模型,在模仿人類跟馳行為方面具有更高的優越性。
聲明:
“基于深度強化學習的擬人化自動駕駛跟馳模型” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)