本說明書實施例提供一種激勵決策模型的運動引導方法,訓練健康狀態預測模型,預測用戶的健康狀態上升空間,并確定當前階段的健康狀態上升空間,獲取樣本用戶的動作信息和對應的健康狀態變化數據,構造激勵函數,利用樣本用戶的動作信息和對應的健康狀態變化數據對激勵函數進行強化學習,生成動作空間,結合強化學習出的激勵函數構造動作決策模型,在動作空間中進行搜索生成動作策略,計算其激勵函數值,并進行迭代,直至計算出的激勵函數值滿足預設條件,輸出動作策略,持續更新引導用戶運動并進行動作識別,通過利用激勵函數值進行迭代的方式可得到全局最優的動作策略,提高了與用戶的匹配度。
聲明:
“激勵決策模型的運動引導方法、裝置和電子設備” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)