本發明公開一種從研究文獻中提取天然產物數據信息的方法,包括:對研究文獻文本內容進行預處理,以得到多個預處理語句;從所述多個預處理語句中獲取生物物種描述語句和化學成分描述語句;從所述生物物種描述語句中獲取生物物種信息;從所述化學成分描述語句中獲取化學物質信息;至少關聯存儲所述生物物種信息和所述化學物質信息。本申請實施例自動分析天然產物研究文獻的文本內容,并自動識別和提取其中的天然產物化學成分數據信息,用于計算機大規模批量生產具有科學研究價值的天然產物數據,從而避免人工標引數據周期長、成本高等缺陷,達到短時間、低消耗獲取一定規模天然產物化學成分數據集的目的。
聲明:
“從研究文獻中提取天然產物數據信息的方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)