一種基于深度強化學習的優化芯片布局系統及方法,包括:數據預處理模塊、策略網絡模塊、獎勵預測模塊和參數更新模塊,其中:數據預處理模塊讀取并解析pl、net文件,將其中的網表圖信息轉換為智能體的初始狀態以及獎勵函數;策略網絡模塊通過卷積神經網絡和圖神經網絡分別得到分別包含粗細粒度的全局嵌入特征與結點嵌入特征,將兩個網絡分別得到的特征向量融合,最終預測出當前時刻行為,即元件可能的放置位置的概率分布;獎勵預測模塊在網表圖內的所有元件都放置完畢后,對布局結果進行總體評價,估計得到線長和擁塞程度指標反饋給智能體;參數更新模塊根據從經驗池中進行采樣得到的樣本采用近端策略優化算法周期地更新神經網絡的參數,實現更好的擬合效果。
聲明:
“基于深度強化學習的優化芯片布局系統及方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)