本發明公開了一種基于深度強化學習的毫米波通信波束訓練方法,該方法通過定義強化學習模型中的狀態、目標、獎勵等要素在波束訓練這一實際問題中的具體表示來對毫米波信道進行追蹤;將狀態定義為圖像的形式,使用卷積神經網絡對強化學習中的值函數進行近似,動作定義為基于上一時刻信道最優波束組合的移動方向、距離以及波束覆蓋范圍的三元組形式;在設計獎勵函數時,將一個時間片內有效的數據可達速率作為目標值;在神經網絡的訓練過程中,使用了Q學習的方法來更新網絡參數;利用訓練的深度Q網絡進行預測,選擇Q值最大的動作,該動作對應下一時刻需要測試的波束組合。
聲明:
“基于深度強化學習的毫米波通信波束訓練方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)