本申請涉及數據分析技術領域,尤其涉及一種基于強化學習的信息處理的方法、裝置、設備和存儲介質,包括:獲取原始數據并對原始數據進行預處理,得到樣本數據;獲取目標值,提取樣本數據中的實際值,將目標值與實際值入參到預設的獎懲函數中進行計算,得到實際值的評分權重;獲取樣本數據對應的多個備選方案數據,將各備選方案數據和實際值的評分權重導入到用于強化學習模型中進行評分后,得到各備選方案數據的初始評分;根據預設的加分策略對初始評分進行處理后得到備選方案數據的最終評分;根據預設的業務邏輯對各備選方案數據進行過濾,以過濾后的備選方案數據中最終評分最高項作為原始數據的目標方案數據。提升了信息處理的速度和準確性。
聲明:
“基于強化學習的信息處理方法、裝置、設備和存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)