用于在多主體強化學習中利用遞歸推理圖的系統和方法,所述系統和方法包括:接收與在多主體環境內行進的自我主體和目標主體相關聯的數據;以及利用多主體中心參與者評論者框架分析與所述自我主體和所述目標主體相關聯的所述數據。所述系統和方法還包括:基于所述多主體參與者評論者框架執行k級遞歸推理以計算所述自我主體和所述目標主體的更高級別遞歸動作。所述系統和方法還包括基于以下至少一者控制所述自我主體和所述目標主體中的至少一者在所述多主體環境內操作:與所述自我主體相關聯的主體動作策略和與所述目標主體相關聯的主體動作策略。
聲明:
“用于在多主體強化學習中利用遞歸推理圖的系統和方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)