本發明公開了一種深度強化學習模型對抗攻擊的防御方法,通過訓練樣本觀測數據內部統計規律,基于所得的概率分布模型,產生與原始樣本同分布的樣本,使模型能抵御不同類型的對抗攻擊,較之其他防御算法,本發明提供的防御方法在保證防御效果的基礎上,具有更強的泛化能力和魯棒性。此外,本發明的對抗樣本是在原始樣本基礎上加入擾動后生成,再將對抗樣本中的擾動去除重構為原始樣本,因此本發明提供的防御方法更具可解釋性。樣本數據形成了一個從對抗攻擊到防御的閉環,滿足循環一致性的原則。
聲明:
“深度強化學習模型對抗攻擊的防御方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)