本發明公開了一種基于改進強化學習的復雜網絡局部破壞的自改進恢復策略方法,解決了復雜網絡進行集群維修的恢復策略生成的問題。步驟如下:1根據局部破壞信息建立復雜網絡的集群維修狀態矩陣。2基于初始集群維修狀態生成復雜網絡鄰接矩陣。3基于神經網絡模型預測集群的先驗維修狀態轉移概率和維修策略價值。4基于蒙特卡洛樹搜索算法遍歷集群的維修策略解空間,并選擇當前時刻全局最佳維修動作。5基于集群維修狀態的變化更新復雜網絡鄰接矩陣。6基于集群維修狀態和鄰接矩陣計算并檢驗復雜網絡的恢復程度。7基于強化學習經驗參數訓練神經網絡參數。8基于恢復策略自改進過程的一系列最佳維修動作生成一個完整的維修恢復方案。
聲明:
“基于改進強化學習的復雜網絡局部破壞的自改進恢復策略” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)