本發明涉及人工智能技術領域,具體涉及一種面向模擬推演的主動式序列決策方法、裝置和介質,該方法包括如下步驟:步驟1,面向大規模強化學習的系統狀態劃分;步驟2,模擬推演環境的持續數據采集;步驟3,基于流數據的實時狀態預測與判斷;步驟4,啟動基于多主體多目標強化學習的決策。本發明有以下優點:(1)為模擬推演系統提供主動式決策支持,可以避免或延緩未來某一異常狀態的發生;(2)通過并行算法支持大規模多主體多目標強化學習?;谶@些優點更好地解決了如何高效地在模擬推演環境中尋求可以避免損失的優化序列決策,從而指導現實環境中決策的問題。
聲明:
“面向模擬推演的主動式序列決策方法、裝置和介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)