本發明涉及數據處理領域,其公開了一種基于深度強化學習的自適應博弈算法,包括如下步驟:(A)獲取不同合作程度的策略;(B)生成不同合作程度的策略;(C)檢測對手的合作策略;(D)制定不同的應對策略。本發明的有益效果是:利用訓練出來的檢測器和不同合作程度的策略,將已有的Tit?for?tat等思想實現運用在sequential?social?dilemmas中;提高了智能體agent的擴展性;更加直觀的獲取更優于自身的競爭策略。
聲明:
“基于深度強化學習的自適應博弈算法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)