本發明是一種基于演員?評論家網絡確定預測SQL序列準確性的方法。本發明公開了一種基于強化學習的SQL語句構造方法及裝置,其技術步驟為:初始化演員?評論家網絡參數;從數據集獲取自然語言和真實SQL語句序列對;把自然語言序列輸入演員網絡編碼器,真實SQL序列輸入到評論家網絡編碼器;編碼后的隱狀態作為對應解碼器的初始化隱狀態;演員網絡解碼器逐步預測SQL語句動作,輸入到評論家網絡解碼器和環境得到相應獎勵;梯度更新網絡參數,重復迭代后得到自然語言到SQL語句的構造模型;本發明基于強化學習將語法自動機引入獎勵機制,解決了在自然語言轉化構造SQL語句中損失函數和評價指標不對等的問題,有效地提高了準確率。
聲明:
“基于演員-評論家網絡的SQL語句構造方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)