本發明公開一種基于強化學習的智能模糊測試方法、裝置及系統,所述方法包括:收集到模糊測試中不同種子的程序運行狀態后,使用聚類算法對各個程序運行狀態進行分類,得到分類結果,并根據所述分類結果得到各個種子狀態,所述種子狀態為類別標簽;收集模糊測試中的歷史變異數據;根據所述歷史變異數據和所述種子狀態進行強化學習,得到變異策略,所述變異策略包括種子狀態與變異動作的選擇概率分布的映射關系。通過學習,在需要進行動作選擇時,將種子輸入到變異策略構建的策略網絡中,輸出變異動作選擇策略,使用智能的變異動作對種子進行變異,能夠提高能夠覆蓋更多的程序運行狀態的種子的權重,充分探索測試用例,發現更多的安全漏洞。
聲明:
“基于強化學習的智能模糊測試方法、裝置及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)