本發明公開了一種基于相似上下文和強化學習的中文詞向量生成方法,解決了現有的中文詞向量生成方法都是考慮基于目標詞的相鄰上下文和目標詞的關系來進行預測的,沒有考慮到在中文中有些單詞雖然相鄰,但是語義不相關的情況,且詞向量的表示質量不高問題。本發明方法包括:選取語料庫,進行語料庫預處理,從而構建中文語料庫;對中文目標詞進行相似上下文發現,獲得與中文目標詞的語義相關的相似上下文;構建中文詞向量強化學習框架,并進行強化學習,得到中文目標詞的詞向量表示。本發明能夠解決中文相鄰詞不相關的問題,生成高質量的中文詞向量。
聲明:
“基于相似上下文和強化學習的中文詞向量生成方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)