本發明公開了一種基于強化學習的服務流程構造方法。將流程構造過程視作圖生成過程,使用有向無環圖來表示服務流程圖,并使用基于深度隨機游走的方法來生成服務流程圖的圖嵌入表示向量;將圖嵌入向量輸入策略神經網絡和價值神經網絡,策略神經網絡的輸出為對服務流程圖中的下一條邊的預測,價值神經網絡的輸出為對當前服務流程圖價值的估計;根據服務流程構造的不同優化目標來設計獎勵函數,將其作為神經網絡參數學習的信號,并使用基于策略梯度的方法來學習神經網絡參數。本發明提供的基于強化學習的服務流程構造方法能根據不同的流程構造目標來學習流程構造方法的參數,并自動化挑選合適的服務實體來進行流程構造。
聲明:
“基于強化學習的服務流程構造方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)