本發明涉及行人軌跡預測與分析技術領域,尤其涉及一種基于融合逆強化學習的軌跡預測方法,包括S1、基于輸入的觀測軌跡和場景圖生成路徑獎勵地圖和終點獎勵地圖;S2、利用逆強化學習算法對策略采樣得到路徑;S3、利用全卷積網絡進行路徑位置編碼,融合雙向門控循環單元對場景路徑編碼,融合場景路徑和行人觀測軌跡。本發明通過引入輕量化的特征提取ENet網絡,減少了算法參數量,提升了算法理解場景的泛化能力;利用場景的注意力機制模塊,更好的融合場景信息和行人觀測軌跡,場景導向的行人軌跡預測網絡S2Tirl相較于主流算法在公共數據集和實際數據上都取得了更好的效果。
聲明:
“基于融合逆強化學習的軌跡預測方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)