本發明公開的一種基于隨機哈希的異常檢測算法,屬于機器學習和數據挖掘領域。本發明的異常檢測算法基于集成的思想,采取了哈希和隨機森林相結合的方法,數據點的異常分數由該點所落入的葉子結點中數據點個數來衡量。對于一個待測的數據點,其所落入的葉子結點中數據點個數越少,則該數據點是異常點的可能性越大。同傳統的基于密度和基于距離的方式相比,本發明中的方法具有更高的準確性,并且其所需的運行時間要比傳統方式少很多。也能夠克服傳統方式在高維情況下失效的問題。
聲明:
“基于隨機哈希的異常檢測算法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)