本發明涉及一種基于深度強化學習的寬帶無線通信自主選頻方法及系統。該方法包括:獲取寬帶OFDM波形信道;將寬帶OFDM波形信道劃分為多個獨立子信道;將各獨立子信道進行感知,將感知結果作為深度強化學習的環境狀態信息;獲取通信系統的待優化參數,將待優化參數的組合作為深度強化學習的動作空間,動作空間包含多個決策目標;構建深度強化學習神經網絡;將環境狀態信息作為深度強化學習神經網絡的輸入,決策目標作為深度強化學習神經網絡的輸出,對深度強化學習神經網絡進行訓練,得到訓練后的深度強化學習神經網絡;根據訓練后的深度強化學習神經網絡對待預測寬帶OFDM波形信道進行自主選頻,得到最優信道。本發明能夠提高抗干擾能力。
聲明:
“基于深度強化學習的寬帶無線通信自主選頻方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)