本發明涉及一種強化學習單元匹配循環神經網絡系統及其訓練和預測方法,包括循環神經網絡、強化學習單元和單調趨勢識別器,循環神經網絡包括輸入、輸出和多個隱層,隱層包括多個隱層節點,單調趨勢識別器判斷由輸入構建的時間序列的趨勢狀態,強化學習單元為根據輸入時間序列的趨勢狀態,選擇一個隱層層數和隱層節點數與其變化規律相適應的循環神經網絡。本發明通過判斷輸入時間序列的趨勢狀態,用趨勢狀態和不同隱層層數及隱層節點數分別表示Q值集的狀態與動作,根據更新后的Q值集來選擇執行最優的動作,增強了RLUMRNN的泛化能力和收斂速度,本發明應用于旋轉機械的剩余壽命預測的精度高。
聲明:
“強化學習單元匹配循環神經網絡系統及其訓練和預測方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)