本發明公開了一種基于深度強化學習的信息聚合短波選頻方法。該方法為:將高動態的短波環境下的選頻問題,轉化為高動態短波通信環境下的信道增益、用戶間的互擾和環境中的干擾三個子問題;對于高動態短波通信環境下的信道增益問題,把短波信道情況輸入神經網絡,對短波下一個時刻的信道增益進行預測,并將輸出記為G;對于用戶間的互擾和環境中的干擾問題,通過深度強化學習網絡訓練得到下一個時刻選擇每一個信道的通信干擾情況,并將輸出記為R;把訓練的到的G與R輸入到信息聚合深度強化學習網絡,通過數據的不斷訓練,深度強化學習網絡得到下一個時刻信道選擇的最優解,指導下一個時刻選頻。本發明提升了復雜環境下的短波通信能力。
聲明:
“基于深度強化學習的信息聚合短波選頻方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)