權利要求
1.露天礦運行設備的感知方法,其特征在于,包括以下步驟: 步驟1、Faster R-CNN模型訓練 步驟1.1、利用攝像頭對目標對象所在環境進行視頻采集,將視頻按幀截取圖像數據,并剔除不包含目標對象的圖像數據; 步驟1.2、將截取的圖像數據擴增,獲取更多圖像數據; 步驟1.3、數據集制作; 步驟1.4、深度學習目標檢測模型建立及模型訓練; 步驟2、視頻關鍵幀提取 步驟2.1、提取待處理視頻中所有幀; 步驟2.2、初始化從第一幀到最后一幀的循環; 步驟2.3、選擇當前幀和下一幀; 步驟2.4、計算當前幀和下一幀的直方圖差值; 步驟2.5、計算直方圖差值的均值μ和標準差δ; 步驟2.6、設定閾值T,通過計算公式:T=μ+αδ設定,α值取3~5; 步驟2.7、重復步驟2.2~2.4,直到當前幀為最后一幀; 步驟2.8、比較每一個直方圖差值是否大于閾值; 步驟2.9、選擇滿足步驟2.8條件的當前幀為關鍵幀,并記錄當前幀的幀序號; 步驟3、模型調用與視覺感知 步驟3.1、利用步驟1中訓練得到的視覺感知模型對步驟2提取出的關鍵幀進行目標對象檢測,得到帶有檢測包圍框的單張圖像; 步驟3.2、將檢測后帶有包圍框的單張圖像按照步驟2記錄的幀序號還原回原視頻當中,形成帶有檢測效果的視頻。2.根據權利要求1所述的露天礦運行設備的感知方法,其特征在于,步驟1.2、將截取的圖像數據擴增,獲取更多圖像數據的方法為: 步驟1.2.1、采用生成對抗網絡進行數據擴增; ①將采集到的圖像數據按圖像類別分類,組成只含有單個類別的小數據集; ②利用各個小數據集分別對生成對抗網絡進行數據生成模型訓練,得到能夠生成各個類別物體的生成模型。 ③調用生成模型定向生成各個種類物體的數字圖像; 步驟1.2.2、對1.2.1中生成的數字圖像進行隨機裁剪、隨機角度旋轉、噪聲抖動、RGB強度隨機調節,獲取更多圖像數據。 3.根據權利要求1所述的露天礦運行設備的感知方法,其特征在于,步驟1.3、數據集制作的方法為: 步驟1.3.
聲明:
“露天礦運行設備的感知方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)