一種基于語法監督和深度強化學習的蒙漢神經機器翻譯方法,本發明首先對蒙漢平行語料進行預訓練處理,并利用Stanford CoreNLP對漢語語料進行句法結構分析,得到的語法解析塊序列也作為神經網絡的訓練數據;其次,以非自回歸Transformer模型作為基本翻譯模型,加入卷積神經網絡句子主題提取模塊和語法解析塊序列的預測模塊;然后,使用訓練數據對模型進行訓練;最后,運用深度強化學習對模型的參數進行優化微調。本發明提供的算法,顯式的將漢語語法知識融入神經機器翻譯的過程中,使翻譯的句子有更好的語法結構,使模型具有一定的可解釋性,而DRL的優化微調則緩解了NMT普遍存在的詞級訓練目標函數和句子級評價函數不一致的問題,進一步提高了模型的翻譯性能。
聲明:
“基于語法監督和深度強化學習的蒙漢神經機器翻譯方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)