本申請公開了混合精度神經網絡量化方法、裝置及設備。其中,所述方法通過結合強化學習和驗證數據生成技術來確定混合精度量化策略,使得基于自動生成的驗證數據集來確定混合精度網絡和待量化網絡輸出的分布差距,以此作為評判量化策略效果的標準。采用這種處理方式,無需用戶提供用于檢驗量化網絡的準確率的驗證數據,且降低了驗證量化網絡準確率的耗時;無需用戶微調通過強化學習確定的量化網絡,即可獲得用較小精度損失換取較大計算量降幅的量化網絡,且簡化了網絡量化流程,實現了用戶無感的模型量化策略搜索;因此,在確保模型精度損失較小的前提下,可以有效提升模型量化效率,保護用戶的數據隱私,以及降低人工成本。
聲明:
“混合精度神經網絡量化方法、裝置及設備” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)