一種基于強化學習的電力設備檢修決策生成方法涉及電力設備檢修技術領域,解決了現有基于強化學習的建模策略的方式需要大量的數據且數據利用率不高的問題,包括:計算第一割集并據此計算電力設備引起電網停電損失的第一權重;將電力設備檢修決策生成問題建模為一個馬爾可夫決策過程,定義電力設備的運行狀態;應用強化學習方法求解馬爾可夫決策過程得到最優策略和最優策略的價值矩陣,第一權重加權到強化學習的電網的整體運行損失中,強化學習以最小化電網的整體運行損失為目標;計算第二割集并據此計算第二權重,加權到電網的整體運行損失中,改進最優策略。本發明夠間接實現多個電力設備之間的通信,數據利用率高,在專業領域上的應用門檻較低。
聲明:
“基于強化學習的電力設備檢修決策生成方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)