本發明提供一種基于web檢索的實體翻譯方法。包括:利用知識庫中的實體描述信息和待翻譯實體進行web檢索;利用所述知識庫中的實體描述信息對歷史檢索結果進行序列標注得到至少一個候選實體翻譯;據歷史檢索結果中的當前字/詞的TF?IDF值以及所述當前字/詞與所述待翻譯實體共現概率得到至少一個候選增強詞;統計所述候選實體翻譯和所述候選增強詞之間的相關統計量,生成或者更新檢索狀態表;將所述檢索狀態表作為強化學習的狀態集,將所述至少一個候選增強詞以及特殊“結束”動作作為強化學習的動作集,通過強化學習機制得到最優檢索增強詞選擇策略,并在結束時以出現次數最高的候選實體翻譯作為最終實體翻譯。本發明能夠提高實體翻譯的準確性和翻譯效率,同時能夠避免未登錄詞和實體名歧義性的問題。
聲明:
“基于web檢索的實體翻譯方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)