本發明公開了一種基于深度強化學習的合成孔徑共相檢測方法,包括:合成孔徑成像探測模塊負責采集或者模擬多個子孔徑的共相圖像,為深度強化學習網絡提供學習環境和狀態;深度強化學習網絡模塊主要由環境、狀態、獎賞和動作組成。在強化學習過程中,Agent選擇一個動作用于環境,環境接受該動作后狀態發生變化,同時產生一個強化信號(獎或懲)反饋給Agent,Agent根據強化信號和環境當前狀態再選擇下一個動作,選擇的原則是使受到正強化(獎)的概率增大,最終實現合成孔徑的共相檢測。該方法不需要采集大量的樣本數據進行訓練,而是通過實時在線學習的方式建立輸入與輸出之間的映射關系,有利于深度強化學習網絡共相檢測方法的實際應用。
聲明:
“基于深度強化學習的合成孔徑共相檢測方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)