本發明公開了一種基于深度Q網絡的用戶分簇與功率分配方法、設備和介質,利用用戶分簇與功率分配問題建模聯合優化問題;建立BP神經網絡實現聯合優化問題中的功率分配功能;使用訓練數據集訓練BP神經網絡,測試網絡并保存BP神經網絡模型,得到不同信道條件下的功率分配結果,實現功率分配;將用戶分簇問題建模成強化學習任務;根據強化學習任務構建深度Q網絡;網絡在線訓練后,根據輸入狀態訓練深度Q網絡,選取最佳動作作為最佳分簇結果,實現用戶分簇。本發明能夠降低在線計算復雜度,在一定程度上保證用戶公平性及有效提高系統的頻譜效率。
聲明:
“基于深度Q網絡的用戶分簇與功率分配方法、設備和介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)