本公開實施例是關于一種基于多智能體深度強化學習的波束預測方法。該基于多智能體深度強化學習的波束預測方法包括:深度神經網絡利用瞬時信道狀態信息學習無線信道的關鍵傳播特性;Q網絡利用所述深度神經網絡輸出估計動作?值函數,計算網絡參數梯度,并讓每個智能體依次做出下一次波束預測;利用所述Q網絡輸出參數更新所述深度神經網絡權值,實現對動態用戶的精準波束預測。本公開實施例利用深度神經網絡獲取多個能反映信道特征的關鍵值,使多天線(MIMO)系統的波束預測更符合動態用戶信道的時變特性,提高波束切換成功率,減小大規模多天線(MIMO)系統的反饋開銷,從而提高和速率。
聲明:
“基于多智能體深度強化學習的波束預測方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)