本發明為一種融合用戶偏好預測的深度強化學習推薦方法,屬于大數據人工智能深度學習領域。該方法包含以下步驟:S1:錄入用戶行為和項目的歷史交互相關數據,對數據進行預處;S2:根據用戶行為,建立用戶長短期偏好模型,得到歷史用戶偏好;S3:建立用戶未來偏好預測模型,預測下一時刻的未來用戶偏好;S4:建立用戶、項目、時間之間的上下文知識表征;S5:利用注意力機制將歷史用戶偏好、未來用戶偏好和用戶的上下文知識表征進行融合,得到用戶當前時刻的狀態表征;S6:搭建基于強化學習網絡的推薦系統;S7:利用訓練好的推薦系統對用戶進行項目推薦。本發明方法能夠增強用戶偏好不確定的表征能力,提升推薦系統的用戶體驗感。
聲明:
“融合用戶偏好預測的深度強化學習推薦方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)