一種強化學習輔助的大規模MIMO的Damped?BP檢測方法,采用強化學習中的Q?Learning算法尋找阻尼置信傳播Damped?BP算法中的最佳阻尼因子,以此來提升Damped?BP檢測算法的性能。將Damped?BP算法中的阻尼因子大小作為Q?Learning算法中的狀態,動作設置為增大或減小阻尼因子,形成Q?Table。通過每次BP算法得到的誤碼率大小來決定給系統一個正向還是負向的回饋,誤碼率小,則給一個正向的回報;誤碼率大,則給一個負向的回報。這樣,通過合理設置Q?Learning算法中的學習率、折扣因子以及訓練次數,得到在某種動作下回報最大的狀態,與之對應的阻尼因子也就是最佳阻尼因子,從而完成最佳阻尼因子尋找,提升了Damped?BP檢測算法的性能,進而提升大規模MIMO的檢測性能,能更好地滿足實際通信高可靠低時延需求。
聲明:
“強化學習輔助的大規模MIMO的Damped-BP檢測方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)