本發明公開一種擴散分子通信環境下基于強化學習的多層自適應獎勵目標溯源方法。首先輸入算法所需的參數,設計多層閾值模型和分子探測器的運動方式;然后,讓分子探測器探索若干回合獲取閾值的初始值并更新獎勵信息;最后,以固定回合數更新多層閾值,接收機經過若干次迭代之后找到目標。本發明能夠解決復雜擴散分子通信環境下分子探測器的路徑規劃問題。該方案具有定位精度高、復雜度低、快速定位等優點。
聲明:
“擴散分子通信環境下基于強化學習的多層自適應獎勵目標溯源方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)