本發明公開了一種基于DDPG的發射資源智能認知管理方法,包括:構建并訓練LSTM預測網絡;利用深度強化學習智能體感知環境,以獲取目標狀態的觀測值;將目標狀態的觀測值輸入已訓練的LSTM預測網絡,得到目標的先驗信息表示;將目標的先驗信息表示輸入Actor?Critic網絡,得到動作向量;根據動作向量生成發射波束并分配功率,以實現發射資源的智能管理。本發明提供的基于DDPG的發射資源智能認知管理方法,簡化了優化過程,提高了跟蹤精度;且未限制發射波束與目標個數的數量關系,使得資源分配更合理,資源的利用效率更高,應用范圍更廣泛。
聲明:
“基于DDPG的發射資源智能認知管理方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)