本發明公開了一種基于深度強化學習的視頻編碼幀內碼率控制方法,采用A3C算法,首先采用不同分辨率的視頻進行編碼并記錄實際編碼信息以制作離線訓練數據集,然后定義行動網絡和批評網絡的結構和輸入輸出,再利用離線訓練數據集訓練定義好的網絡,訓練完成后將網絡嵌入到HM編碼軟件中,當視頻編碼進行到幀內碼率控制流程時,調用該網絡預測得到當前CTU的QP并計算當前的拉格朗日優化因子,利用得到的QP和拉格朗日優化因子對當前CTU進行編碼,實現幀內碼率控制。本發明的方法相對于傳統的幀內碼率控制方法以及現有的基于深度強化學習的幀內碼率控制方法,率失真性能都有一定的提升。
聲明:
“基于深度強化學習的視頻編碼幀內碼率控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)