本發明公開一種規則約束下基于深度強化學習的船舶避碰決策方法。該方法考慮船舶操縱特性,引入MMG模型,通過該模型推斷船舶實時的航行信息。然后設計了分場景、考慮駕駛經驗的狀態空間和動作空間定義方法,并提出了避碰決策網絡構建和訓練框架。此外,為了充分考慮規則,設計了一套分層的獎勵函數組合,并將其用于后期決策網絡的訓練。隨后通過引入DQN算法,構建了避碰決策網絡訓練模型,并經過大量的訓練獲得了可適用于不同場景的避碰決策網絡。最后,為了驗證所提方法的適用性,設計了多種仿真測試場景進行了綜合性能評價。該方法能夠使船舶在復雜環境下安全避碰,同時保證其符合規則和良好船藝的要求。
聲明:
“規則約束下基于深度強化學習的船舶避碰決策方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)