一種用于開發強化學習系統的框架及方法,其特征在于它是由與外部環境交互的學習者接口、表示環境狀態的狀態接口、系統通過執行部件執行動作的動作接口、基本的測試環境等部分組成框架,然后利用框架開發強化學習系統,其中學習者接口通過狀態接口獲取環境狀態,經過學習更新內部狀態并做出決策,調用動作接口作用于環境,同時提供了本研究組提出的新的基于量子理論的多機器人強化學習算法實現作為實例演示。開發人員只需要按照一定步驟實現相應的接口即可完成機器人或其他智能裝置學習模塊的開發。本發明可移植性高,可以在眾多平臺運行,可與其他機器人系統框架結合使用,大大降低了學習算法編寫的復雜度,方法簡單。
聲明:
“用于開發強化學習系統的框架及方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)