本發明屬于網絡安全技術領域,特別涉及一種基于強化學習和攻防博弈的智能防御決策方法及裝置,該方法包含:在有限理性約束下構建攻防博弈模型,并生成用于提取博弈模型中網絡狀態與攻防動作的攻防圖,該攻防圖設定為以主機為中心,攻防圖節點提取網絡狀態,攻防圖邊分析攻防動作;防御者在網絡狀態轉移概率未知時,通過在線學習得到防御收益使得防御者面對不同攻擊者時自動做出最優防御策略的選擇。本發明有效壓縮博弈狀態空間,降低了存儲和運行開銷;防御者在與攻擊者對抗中依據環境反饋進行強化學習,在面對不同攻擊時能自適應做出最優選擇;提升防御者學習速度,提高了防御收益,減少對歷史數據依賴,有效提升防御者決策時的實時性和智能性。
聲明:
“基于強化學習和攻防博弈的智能防御決策方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)