基于機器視覺(jué)的帶鋼焊縫定位
冷軋連退生產(chǎn)線(xiàn)的原材料為帶鋼卷,為保持生產(chǎn)的連續性,需將前一個(gè)帶鋼卷的尾部與后一個(gè)帶鋼卷的頭部焊接起來(lái),從而得到連續的帶鋼材料。為了避免焊縫焊接質(zhì)量問(wèn)題引起的帶鋼撕裂或者斷帶事故的發(fā)生[1],需要對焊接質(zhì)量進(jìn)行檢測,文中分析了帶鋼焊縫焊接質(zhì)量的自動(dòng)檢測系統中應用旋轉目標檢測算法對月牙邊焊縫的識別和定位算法及評判標準,并進(jìn)行了實(shí)驗分析。
本文引用地址:http://dyxdggzs.com/article/202212/442064.htm1 算法分析
1.1 CenterNet
CenterNet 網(wǎng)絡(luò )的輸出為3 個(gè)部分,依靠邊緣特征信息獲取的檢測目標中心點(diǎn)的預測熱力圖,匹配角點(diǎn)獲取預測寬高模塊(Object Size) 回歸目標的寬和高,Offsets 模塊回歸中心點(diǎn)偏移量[3-4]。
1.2 金字塔分割注意力
為了在不增加模型復雜度的前提下解決主流注意力目前存在的問(wèn)題,金字塔分割注意力(PSA Module) 機制以通道注意力機制為基礎[5-6],通過(guò)使用不同大小的卷積核來(lái)獲取多尺度的特征圖。輸入特征圖通過(guò)四個(gè)不同大小卷積核的卷積操作將特征圖切分為4 個(gè)部分,接著(zhù)對含有不同尺度特征的特征圖進(jìn)行拼接,定義如式(1)所示。
其中,Cat 為concat 算子;Z 為多尺度注意力權重向量。
直接拼接的多尺度注意力權重向量不滿(mǎn)足所有權重之和為1,通過(guò)使用Softmax 對多尺度注意力權重進(jìn)行全局歸一化實(shí)現了局部與全局通道注意力的交互,定義如式(4)所示。
其中,att 代表注意力交互后的多尺度通道注意力權重。
在獲取多尺度預處理的特征圖F 和重新校準的多尺度通道注意力權重att 后,將兩者按對應元素進(jìn)行點(diǎn)乘操作,輸出含有多尺度特征信息注意力的特征圖,定義如式(5) 所示。
其中, ? 代表按通道方式的乘法;注意力交互后的多尺度通道權重。Y 代表得到的含有多尺度特征信息注意力的特征圖。
1.3 定位算法
1.3.1 R-Center Net
通過(guò)使用改進(jìn)的R-CenterNet 算法對月牙邊焊縫進(jìn)行旋轉目標檢測, R-CenterNet 相較于CenterNet 在經(jīng)過(guò)上采樣獲取高分辨率特征圖后的head 部分,增加了一路特征圖來(lái)回歸矩形框的旋轉角度信息。增加的這一路特征圖的構建方法與寬高圖的獲取方法相同,不同點(diǎn)為獲取含有旋轉因子角度圖的卷積層僅需要1 個(gè)輸出通道。
1.3.2 損失函數
R-CenterNet 算法的損失函數為熱力圖的中心點(diǎn)預測損失函數、寬高圖的尺寸預測損失函數、中心點(diǎn)修正圖的中心點(diǎn)偏置損失函數和角度圖的損失函數之和,定義如式(6)所示。
2 實(shí)驗與分析
2.1 實(shí)驗環(huán)境
實(shí)驗服務(wù)器的硬件配置分別為15.5 GiB 內存,Intel Core i7-6800K 中央處理器,NVIDIA GTX1080Ti圖形處理器。軟件配置分別為Ubuntu16.04,Python3.7編程語(yǔ)言,PyTorch 深度學(xué)習框架。
2.2 數據采集及評估
從生產(chǎn)現象采集了1 200 張月牙邊無(wú)規律位置的樣本圖像,隨機選取1 000 張作為訓練集,返回損失更新模型權重,100 張作為驗證集,計算訓練模型的損失但不返回,僅用來(lái)判斷當前模型性能并判斷是否保存當前模型,其余100 張作為測試集,通過(guò)輸出模型的評價(jià)指標來(lái)檢測模型的泛化能力。
從生產(chǎn)線(xiàn)上切割下來(lái)的月牙邊被機械臂隨機的放置在定位相機的視覺(jué)區域內,其中采集圖像的尺寸為3 648×3 648。數據集使用labelImg2 進(jìn)行標注,圖2 對應的標注信息如表1 所示,其中cx 和cy 分別代表標注中心點(diǎn)橫縱坐標,w 和h 分別代表標注框的寬和高,單位均為像素值。angle 代表標注框相對于垂直向上順時(shí)針的旋轉角度,單位為弧度制。
焊縫定位實(shí)驗的算法網(wǎng)絡(luò ),采用4 個(gè)評價(jià)指標來(lái)評估模型的性能,分別為:精確率(P)、召回率(R)、F 值(F)和檢測速度(S)。
圖2 焊縫定位實(shí)驗月牙邊樣本
其中精確率的定義如式(11)所示。
其中,num_image為測試集的圖片數量,time 為檢測測試集圖片的總時(shí)間。
2.3 實(shí)驗結果分析
通過(guò)實(shí)驗對比不同骨干網(wǎng)絡(luò )下R-CenterNet的性能,設計了不同骨干網(wǎng)絡(luò )的3組對比方案進(jìn)行驗證。驗證實(shí)金字塔分割注意力的有效性,實(shí)驗的不同方案所使用結構如表2 所示。
表3 所有方案使用相同的參數:①初始學(xué)習率設置為0.000125,總訓練步數為50 步,從第20 步開(kāi)始每隔10 步將初始學(xué)習率乘以0.1;②優(yōu)化器采用Adam,權重衰減設置為0.0001;③訓練集和驗證集的批量均設置為4,訓練集進(jìn)行隨機打亂處理,驗證集不進(jìn)行打亂處理。
在獲取最優(yōu)模型后通過(guò)測試集對模型進(jìn)行評估,設置所有實(shí)驗方案的中心點(diǎn)置信度閾值為0.3、預測框與標注框的重合度閾值為0.3,所得的輸出精確率(P)、召回率(R)、F 值(F)和檢測速度(S)如表3 所示。
由表3 方案1 與方案2 的數據可知,增加網(wǎng)絡(luò )深度不能提高本章實(shí)驗的模型精度,反而會(huì )減少一定的檢測速度。將骨干網(wǎng)絡(luò )更換為DLANet 后,精確率、召回率和F 值分別上升了1.01、1.00 和1.00 個(gè)百分點(diǎn),單張圖片的檢測時(shí)間減少了6.4 ms 秒。方案4 證明了在提取特征時(shí)使用金字塔分割注意力均能較明顯的提高檢測結果的F 值。金字塔分割注意力使該模型的精確率增加了1.01 個(gè)百分點(diǎn),召回率提高了1.00 個(gè)百分點(diǎn),說(shuō)明該模塊主要增強的是模型精確率。
3 結束語(yǔ)
本文通過(guò)對比試驗證明基于DLANet 骨干網(wǎng)絡(luò )的算法檢測速度更快、檢測精度更高。同時(shí)證明了金字塔分割注意力能夠增強模型的泛化能力,實(shí)驗結果表面旋轉目標檢測算法能夠對滿(mǎn)足月牙邊焊縫的識別和定位要求。
參考文獻:
[1] 趙宗楠,劉文亮,歐家.搭接滾壓焊機傳動(dòng)側焊縫開(kāi)裂原因分析[J].南方金屬,2022(1):6-9.
[2] 余瓊,賈建,唐萬(wàn)象.連退機組在線(xiàn)全自動(dòng)帶鋼焊縫感應退火裝置研究與開(kāi)發(fā)[J].冶金動(dòng)力,2020(6):71-74.
[3] 邵光梅.基于深度卷積網(wǎng)絡(luò )的板帶鋼表面缺陷類(lèi)別檢測[D].馬鞍山:安徽工業(yè)大學(xué),2019.
[4] TULBURE A A, DULF E H. A review on modern defect detection models using DCNNs–Deep convolutional neural networks[J].Journal of Advanced Research, 2022,35: 33-48.
[5] JIANG Y, ZHU X, WANG X, et al. R2CNN: Rotational region CNN for orientation robust scene text detection[J].arXiv preprint arXiv:1706.09579, 2017.
[6] 王明陽(yáng),王江濤,劉琛.基于關(guān)鍵點(diǎn)的遙感圖像旋轉目標檢測[J].電子測量與儀器學(xué)報,2021,35(6):102-108.
(本文來(lái)源于《電子產(chǎn)品世界》雜志2022年12月期)
評論