本發明通過網絡安全領域的方法,實現了一種基于雙注意力模型的圖像描述方法。采用“編碼器?解碼器”框架結構完成圖像描述研究任務,將卷積神經網絡+長短期記憶網絡+注意力機制結合的框架;首先構建編碼器,借助ResNeXt?101網絡和目標檢測器Faster R?CNN來構建新的編碼器模型以此獲取待測圖像的目標區域并進行特征提??;之后構建解碼器,使雙注意力機制和雙層LSTM構建新的解碼器來生成圖像的描述語句;最后對模型進行優化,采用REINFORCE強化學習算法對模型進行優化。本發明提供的方法能夠有效的提高圖像描述模型的準確率以及圖像描述內容的豐富度,提高圖像描述模型的整體性能。
聲明:
“基于雙注意力模型的圖像描述方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)