Trans論文 | Proposal Learning用于半監督的目標檢測
這次分享的以半監督目標檢測為研究對象,通過(guò)對有標簽和無(wú)標簽數據的訓練,提高了基于候選的目標檢測器(即two-stages目標檢測器)的檢測精度。然而,由于真值標簽的不可用性,在未標記的數據上訓練目標檢測器是非常重要的。
概要
為了解決這個(gè)問(wèn)題,于是就提出了一個(gè) proposal learning方法從標記和未標記的數據中學(xué)習候選的特征和預測。該方法由自監督候選學(xué)習模塊和基于一致性的候選學(xué)習模塊組成。在自監督候選學(xué)習模塊中,分別提出了一個(gè)候選位置損失和一個(gè)對比損失來(lái)學(xué)習上下文感知和噪聲魯棒的候選特征;在基于一致性的候選學(xué)習模塊中,將一致性損失應用于候選的邊界框分類(lèi)和回歸預測,以學(xué)習噪聲穩健的候選特征和預測。
最后,在COCO數據集上對所有可用的有標簽和無(wú)標簽數據進(jìn)行了實(shí)驗。結果表明,新方法一致地提高了全監督基線(xiàn)的精度。特別是在結合了數據蒸餾之后,新方法與全監督基線(xiàn)和數據蒸餾基線(xiàn)相比,平均提高AP約2.0%和0.9%。
新框架
Problem Definition
在半監督目標檢測( Semi-Supervised Object Detec-
tion (SSOD) )中,一組標記數據D_l={(I,G)}和一組給出了未標記數據的D_u={I},其中I和G分別表示圖像和真值標簽。在目標檢測中,G由一組具有位置和目標類(lèi)的對象組成。SSOD的目標是訓練目標檢測器,包括標記數據D_l和未標記數據D_u。
The Overall Framework
對于每一個(gè)標記數據(I,G)∈D_l,根據標準的全監督損失定義訓練目標檢測器是簡(jiǎn)單的,如下公式:
其中第二項分別表示RPN損失和R-CNN損失。該損失在反向傳播過(guò)程中優(yōu)化θb、θrpn、θr-cnn、θcls、θreg去訓練目標檢測器。有關(guān)損失函數的更多詳細信息,請參見(jiàn):
Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster R-CNN: Towards real-time object detection with region proposal networks. IEEE transactions on pattern analysis and machine intelligence, 39(6):1137–1149, 2017
將上面公式中定義的標準全監督損失應用于標記數據dL,將自監督候選學(xué)習損失Lself和基于一致性的候選學(xué)習損失Lcons應用于未標記數據dU。通過(guò)優(yōu)化反向傳播過(guò)程中的損失方程中的θb,θrpn,θr-cnn,θcls,θreg,θself,對目標檢測器進(jìn)行了訓練:
然后將總損失寫(xiě)成如下:
Self-Supervised Proposal Learning
為了計算對比損失,使用instance discrimination作為pretext task:
結合上面的兩個(gè)公式中的候選位置損失以及對比損失,自監督的候選學(xué)習損失寫(xiě)為:
Consistency-Based Proposal Learning
為了進(jìn)一步訓練抗噪聲目標檢測器,應用一致性損失來(lái)確保噪聲候選預測與其原始候選預測之間的一致性。更準確地說(shuō),將一致性損失應用于邊界框分類(lèi)和回歸預測。對于邊界框分類(lèi)預測C的一致性損失,使用KL散度作為損失,以強制噪聲候選的類(lèi)預測及其原始候選一致。
為了進(jìn)一步確保候選預測的一致性,在下列公式中計算一致性損失,以強制來(lái)自噪聲候選的目標位置預測及其原始候選一致:
結合上面的兩個(gè)公式,基于一致性的候選學(xué)習損失如下:
實(shí)驗
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。