本公開公開了一種信息推送方法、裝置、電子設備及計算機可讀存儲介質,其中,所述方法包括:當檢測到產生信息時,采集信息對應的特征數據,根據特征數據生成當前狀態,并根據推送信息生成第一當前動作;將當前狀態和第一當前動作輸入線上深度強化學習模型,以使線上深度強化學習模型根據當前狀態和第一當前動作獲取推送信息時對應的分值;若推送信息時對應的分值大于預設分值,則推送信息。本公開通過采集產生的信息對應的特征數據,根據特征數據生成當前狀態,并根據推送信息生成第一當前動作,將當前狀態和第一當前動作輸入線上深度強化學習模型,獲取推送信息時對應的分值,若推送信息時對應的分值大于預設分值,則推送信息,可以提高推送準確率,從而提高用戶對信息的點擊率。
聲明:
“信息推送方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)