本說明書實施例提供一種通過強化學習提取主干詞的方法和裝置,方法包括,首先利用句子樣本集,訓練用于句子分類的分類網絡。然后,利用當前策略參數下的策略網絡,對句子樣本集中的樣本句子進行主干詞提取,獲得主干詞集合,并根據該樣本句子中的詞語數目和主干詞集合中的詞語數目,確定當前的第一損失;接著,利用分類網絡對主干詞集合構成的備選句子進行分類處理,獲得該備選句子的分類結果,并根據分類結果以及樣本句子的分類標簽,確定當前的第二損失。如此,可以根據當前的第一損失和第二損失,確定當前的總損失。進而,在總損失減小的方向,更新強化學習系統,其中包括,至少更新所述策略網絡,以用于從待分析句子中提取主干詞。
聲明:
“通過強化學習提取主干詞的方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)