本發明涉及一種強化學習三態組合長短時記憶神經網絡系統,包括長短時記憶神經網絡、強化學習單元和單調趨勢識別器,單調趨勢識別器判斷由輸入時間序列的趨勢狀態,強化學習單元為根據輸入時間序列的趨勢狀態,選擇一個隱層層數和隱層節點數與其變化規律相適應的長短時記憶神經網絡,其中,輸入時間序列的趨勢狀態包括三種狀態,每個趨勢狀態對應一個隱層層數和隱層節點數與其變化規律相適應的長短時記憶神經網絡。本發明判斷輸入時間序列的趨勢,根據更新后的Q值集來選擇執行最優的動作,增強了網絡泛化能力,對于旋轉機械的退化趨勢具有較高的預測精度;通過輸出誤差計算獎勵,提高了網絡的收斂速度,提高了系統的計算效率。
聲明:
“強化學習三態組合長短時記憶神經網絡系統及訓練和預測方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)