本發明公開了一種基于深度學習的英文文獻污染物信息抽取方法,包括:構建適用于本土環境監測文獻文本挖掘的術語詞典;獲取原始文獻,并對原始文獻進行語料分詞,構建文獻生語料;構建實體抽取模型和關系抽取模型;對文獻生語料進行預處理,得到用于實體抽取模型和關系抽取模型的訓練集和測試集;通過訓練集對實體抽取模型和關系抽取模型進行訓練,得到訓練完成的實體抽取模型和關系抽取模型;將測試集輸入至訓練完成的實體抽取模型進行識別,得到實體識別結果;將實體識別結果和測試集數據輸入至訓練完成的關系抽取模型,得到關系抽取結果。本發明不僅實現了原始英文文獻中化學品的命名實體識別,也對化學品及檢測濃度進行了關系抽取。
聲明:
“基于深度學習的英文文獻污染物信息抽取方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)