一種基于強化學習的多用戶圖像數據自適應處理方法包括:分析多用戶輸出中存在的輸出遮擋問題,針對輸出遮擋問題設計輸出策略;對輸出控制問題進行建模得到自適應圖像輸出控制模型,根據輸出策略設置行為動作及相應的獎勵函數;在移動設備端收集環境信息,智能體與環境進行不斷地交互,進行強化學習實現輸出策略的自適應生成;移動設備接收到輸出信息指令后收集狀態信息;若當前狀態信息符合輸出策略,則直接輸出;若不符合輸出策略,則按照最終的輸出控制模型輸出的動作進行調整,將調整后的對象進行輸出。本發明利用強化學習通過與環境的不斷交互自適應的學習到所求的策略,避免隱私信息的泄露同時增加模型學習的信息量,從而增強模型的魯棒性。
聲明:
“基于強化學習的多用戶圖像數據自適應處理方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)