本發明涉及信息處理領域,具體是一種通過強化學習技術實現無人機自主飛行的方法,包括如下步驟:步驟一、獲取模擬數據集和真實數據集;步驟二、提取圖像特征和動作特征;步驟三、使用Q?learn ing訓練一個深度神經網絡Q?funct ion;步驟四、構建現實世界策略學習網絡,將深度神經網絡Q?funct ion訓練好的參數遷移至現實世界策略學習網絡中,訓練行動條件獎勵預測函數;步驟五、輸入狀態向量和H個未來計劃行動向量的序列至行動條件獎勵預測函數,通過一個長短期記憶循環神經網絡整合之后,并在將來的每個時間點輸出預測的獎勵;步驟六、根據預測的獎勵實現自主飛行;該方法能夠使機器人僅使用單目攝像機就可以避免碰撞以實現自主飛行。
聲明:
“通過強化學習技術實現無人機自主飛行的方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)