本發明提供了一種無人車的自主避障方法及裝置、電子設備、可讀存儲介質,包括:獲取當前狀態信息;根據當前狀態信息和歷史狀態信息,避障網絡產生預測評價高的動作信息;執行該前動作信息,重復上述過程,直至到達目的地;其中,避障網絡包括動作生成網絡和策略評價網絡;前者根據當前狀態信息和歷史狀態信息,得到融合狀態信息;再根據融合狀態信息預測當前動作信息;后者根據回報值、融合狀態信息和當前動作信息,得到當前動作信息的預測評價;根據該預測評價調整后續的動作產生策略。本發明通過在強化學習中引入循環神經網絡和注意力機制對過去的異常狀態給予更高的關注度,使無人車憑借對以往異常狀態的記憶,作出有效避障。
聲明:
“無人車的自主避障方法及裝置、電子設備、可讀存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)