本發明涉及人工智能技術領域,提供一種車險報案風險預測方法、裝置、電子設備及存儲介質,搭建深度雙Q網絡作為強化學習模型的框架,基于多個歷史車險報案數據確定強化學習模型的動作集、狀態集及獎勵值,從而利用動作集、狀態集以及獎勵值對強化學習模型進行迭代循環訓練,在進行強化學習時通過經驗回放的方式學習之前的環境,并對回放經驗池進行隨機采樣,能夠消除樣本之間的相關性,增加了強化學習模型的穩定性,使得訓練得到的車險報案風險預測模型的穩定性得到了增強,最后使用車險報案風險預測模型對當前車險報案數據進行風險預測,得到風險預測結果的準確度較高。
聲明:
“車險報案風險預測方法、裝置、電子設備及存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)