本申請涉及內在激勵強化學習領域,特別涉及一種基于文本游戲的強化學習情感分析系統,包括如下模塊:表示狀態的文本描述模塊、情緒分析模塊、外部環境模塊和LSTM?DQN模型模塊,所述表示狀態的文本描述模塊用于表示狀態的文本描述的輸入;所述情緒分析模塊用于分析所述表示狀態的文本描述中的積極和消極軌跡,生成基于情感的獎勵;所述外部環境模塊用于給出外部環境的獎勵;LSTM?DQN模型模塊用于對所述文本描述的狀態表示進行編碼,使用環境給出的獎勵,并從狀態表示中提取基于情感的獎勵作為補充;本發明將稀疏性獎勵問題轉化為稠密性獎勵問題,提高強化學習在處理所述問題的性能,實現了無獎勵環境下的自發學習,提高了強化學習在基于文本游戲中的表現。
聲明:
“基于文本游戲的強化學習情感分析系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)