本發明公開了一種基于模仿與強化學習的醫藥機器人自主避障方法及系統,該方法包括:步驟1:設置醫藥機器人醫藥搬運場景;步驟2:獲取專家演示二元組數據;步驟3:構建基于模仿學習和強化學習的醫藥機器人移動控制模型;步驟4:模型訓練;步驟5:對醫藥機器人進行自主控制。本發明在醫藥機器人移動控制模型中將圖注意模塊引入價值網絡中,使能夠適應智能體和障礙物數量不確定的不同環境,同時,區分了醫藥機器人可觀測范圍內不同智能體和障礙物對移醫藥機器人的影響,使其能夠更好地做出決策。只需一組網絡參數就可以適用于處理各種情況,即網絡具有較好的泛化性。
聲明:
“基于模仿與強化學習的醫藥機器人自主避障方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)