本發明公開了基于深度強化學習的場景文本檢測方法及系統,所述方法包括:訓練一個特征提取網絡;訓練一個決策網絡;通過特征提取網絡和決策網絡定位待檢測圖像上場景文本的位置;其中,所述特征提取網絡為場景文本圖像特征提取的深度卷積神經網絡;所述決策網絡為擬合強化學習Q值函數的神經網絡。本發明將場景文本檢測解析為基于視覺的連續性決策問題,結合強化學習與深度神經網絡,模擬日常生活中人眼從整圖開始逐漸聚焦到目標物體的過程;在訓練過程中,利用深度神經網絡,很好地提取出當前定位框圖像信息,以強化學習方法訓練出能進行目標文本定位的模型。
聲明:
“基于深度強化學習的場景文本檢測方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)