本發明公開了一種基于注意力機制強化學習的邊緣網絡設備緩存方法,包括如下步驟:建立蜂窩網絡模型,蜂窩網絡模型包括用戶設備、邊緣網絡設備和核心網絡,每個邊緣網絡設備中均設有行動網絡模塊和評價網絡模塊;邊緣網絡設備接收所在區域內的用戶設備發出的請求;每個邊緣網絡設備獲取其它邊緣網絡設備的觀測值;每個邊緣網絡設備依據緩存替換策略和觀測值選取動作;邊緣網絡設備發送動作和更新后的狀態到鄰接邊緣網絡設備;根據動作更新后的觀測值和動作價值函數對行動網絡模塊和評價網絡模塊的參數進行更新;根據目標函數對緩存替換策略進行優化。本發明可以減少從云數據中心重復下載文件的次數,降低延遲,提升網絡服務質量與用戶體驗質量。
聲明:
“基于注意力機制強化學習的邊緣網絡設備緩存方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)