本申請涉及材料預測和計算技術領域,且公開了一種文獻挖掘與材料性質預測方法,包括以下步驟:1)抓取有關化學和材料的中文文獻摘要21萬篇;2)使用分詞測試集測試分詞工具,選取最佳分詞工具將數據庫進行分詞;3)使用自定義停用詞庫和自定義詞典將摘要數據庫進行預處理,并整理成LineSentence格式;4)用兩種不同的模型skip?gram和CBOW進行詞向量嵌入訓練,并使用自定義關聯詞測試集測試不同的word2vec模型;5)選取最優模型進行太陽能電池材料的預測。通過第一性原理去計算輔助驗證預測項。通過使用Word2vec詞向量嵌入算法對專業中文文獻摘要數據庫進行自然語言處理,在模型成功輸出太陽能電池材料預測項后,使用第一性原理輔助計算驗證,準確性和有效性更高。
聲明:
“文獻挖掘與材料性質預測方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)