本發明公開了一種基于es倒排索引的化學分子式檢索方法,本發明結合大數據平臺對檢索過程進行重新設計,首先通過對es數據庫中的分子式進行分詞得到的子結構建立倒排索引,并對es數據庫中的分子式計算哈希表示;檢索時對分子式進行分詞得到子結構,并計算哈希表示,利用倒排索引得到子結構匹配的分子式集合,再與得到的分子式集合的哈希表示一一比較,得到輸入分子式與分子式集合中每個分子式之間的相似度,按照應用需要輸出檢索結果。本發明的比較范圍為分子式集合,而不是數據庫中全部的分子式,減少了比較的次數,進一步加快了分子式的檢索。
聲明:
“基于es倒排索引的化學分子式檢索方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)