本說(shuō)明書(shū)實(shí)施例提供一種激勵決策模型的運動(dòng)引導方法,訓練健康狀態(tài)預測模型,預測用戶(hù)的健康狀態(tài)上升空間,并確定當前階段的健康狀態(tài)上升空間,獲取樣本用戶(hù)的動(dòng)作信息和對應的健康狀態(tài)變化數據,構造激勵函數,利用樣本用戶(hù)的動(dòng)作信息和對應的健康狀態(tài)變化數據對激勵函數進(jìn)行強化學(xué)習,生成動(dòng)作空間,結合強化學(xué)習出的激勵函數構造動(dòng)作決策模型,在動(dòng)作空間中進(jìn)行搜索生成動(dòng)作策略,計算其激勵函數值,并進(jìn)行迭代,直至計算出的激勵函數值滿(mǎn)足預設條件,輸出動(dòng)作策略,持續更新引導用戶(hù)運動(dòng)并進(jìn)行動(dòng)作識別,通過(guò)利用激勵函數值進(jìn)行迭代的方式可得到全局最優(yōu)的動(dòng)作策略,提高了與用戶(hù)的匹配度。
聲明:
“激勵決策模型的運動(dòng)引導方法、裝置和電子設備” 該技術(shù)專(zhuān)利(論文)所有權利歸屬于技術(shù)(論文)所有人。僅供學(xué)習研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專(zhuān)利(論文)的發(fā)明人(作者)