本發明提供一種基于深度強化學習的可遷移性網絡流行為異常檢測方法及裝置,所述方法包括模型訓練階段和流量識別階段,模型訓練階段中,基于訓練數據集中的數據點初始化環境;將訓練數據集中的數據點作為本輪次的單輪訓練集,將單輪訓練集中的數據點逐個輸入預設的智能體中進行訓練;根據環境得到該數據點的狀態組,將狀態組輸入到預設的智能體中,輸出動作組,基于動作組輸出數據點的數據類型;將輸出的數據類型與數據點的標簽類型進行比對,獲取獎勵值,對智能體中的參數進行更新;流量識別階段中,接收待測流量數據,將待測流量數據中的數據點輸入智能體得到數據點的數據類型。
聲明:
“基于深度強化學習的可遷移性網絡流行為異常檢測方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)