本發明公開了一種基于深度強化學習的無線網絡擁塞控制方法,屬于無線網絡資源管理以及強化學習領域。該方法包括:無線接入網信息預測網絡的初始化和預訓練,獎勵函數再分配網絡的初始化和預訓練,動作控制網絡、價值評價網絡和表示網絡的初始化和訓練,最后實現無線網絡擁塞控制。本發明得到的擁塞控制方法相較于以往的傳統擁塞控制方法,能得到更高的吞吐量和更低的往返時間,并具有更好的公平性。
聲明:
“基于深度強化學習的無線網絡擁塞控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)