IEEE 2023 I 立體三角測量為什么在無(wú)人機距離估計中不起作用?(1)
本文介紹了群體無(wú)人機的研究和應用的重要性,并說(shuō)明了在無(wú)人機場(chǎng)景中準確估計周?chē)鸁o(wú)人機距離的難點(diǎn)。存在的方法主要依賴(lài)于密集視差預測,但在無(wú)人機場(chǎng)景中存在數據注釋困難和計算資源有限的問(wèn)題。為了解決這些問(wèn)題,本文構建了UAVDE數據集,并提出了一種新的位置校正模塊(PCM)和動(dòng)態(tài)迭代校正(DIC)機制。在UAVDE數據集上的實(shí)驗結果表明,所提出的方法在無(wú)人機距離估計中具有有效性和優(yōu)越性。
作者的主要貢獻有:
形式化了無(wú)人機距離估計任務(wù)并提出了UAVDE數據集。
發(fā)現位置偏差問(wèn)題是損害無(wú)人機距離估計性能的主要挑戰。
提出了一種名為位置校正模塊(PCM)和動(dòng)態(tài)迭代校正(DIC)機制的新修正方法,以準確預測圖像和真實(shí)位置之間的偏移,并用于立體三角測量的計算補償。
在UAVDE數據集上對所提出的方法進(jìn)行了實(shí)驗評估,結果證明了作者方法的有效性和優(yōu)越性。
本文回顧了與作者的工作相關(guān)的經(jīng)典和基于學(xué)習的立體距離估計的文獻。經(jīng)典的立體匹配算法通常包括匹配代價(jià)計算、代價(jià)聚合、優(yōu)化和視差細化四個(gè)步驟,利用不同的像素表示和后處理技術(shù)可以在相對簡(jiǎn)單的場(chǎng)景中取得良好的效果。然而,在復雜的無(wú)人機場(chǎng)景中,現有方法通常受到遮擋、光照變化和無(wú)特征區域等環(huán)境干擾的影響。為了應對這些問(wèn)題,近年來(lái)的研究者開(kāi)始利用深度學(xué)習技術(shù)來(lái)提取像素級特征并進(jìn)行匹配。學(xué)習到的表示在低紋理區域和各種光照下表現出更強的魯棒性。有些方法還試圖在代價(jià)聚合過(guò)程中結合語(yǔ)義線(xiàn)索和上下文信息,取得了積極的結果。然而,基于學(xué)習的方法需要依賴(lài)以激光雷達密集注釋的高質(zhì)量訓練數據,在無(wú)人機場(chǎng)景中很難獲得這種關(guān)鍵的密集注釋數據。因此,本文提出了一種新的數據集,用于無(wú)人機距離估計,該數據集利用UWB傳感器獲取距離,并發(fā)現了無(wú)人機距離估計中的關(guān)鍵問(wèn)題-位置偏差,并提出了一種新的位置修正方法。
3 UAVDE數據集本文介紹了一個(gè)名為UAV Distance Estimation (UAVDE)的新穎無(wú)人機距離估計數據集。數據集使用一架AMOV P600記錄型無(wú)人機和一架DJI M200目標無(wú)人機進(jìn)行立體圖像采集。采集了包括建筑背景、森林、運動(dòng)場(chǎng)和籃球場(chǎng)等典型場(chǎng)景的3895個(gè)立體圖像,并劃分為訓練、驗證和評估三個(gè)子集。為了適應未見(jiàn)場(chǎng)景并解決模型過(guò)擬合問(wèn)題,訓練子集與其他子集包含的場(chǎng)景不同。數據集的注釋過(guò)程中,通過(guò)UWB定位技術(shù)測量了目標無(wú)人機中心位置的距離,并手動(dòng)標注了無(wú)人機邊界框以用于無(wú)人機檢測器的訓練。
本文主要解決了位置偏移問(wèn)題,并提出了一種新穎的位置校正模塊 (PCM)。根據分析,作者使用4元組{θ、r、w、h}來(lái)預測位置偏移,其中θ和r表示相對角度和到圖像中心的半徑,w和h表示檢測到的無(wú)人機邊界框的大小。通過(guò)一個(gè)簡(jiǎn)單的多層感知機 (MLP) 進(jìn)行預測,得到校正量。在訓練過(guò)程中,采用了L2損失函數來(lái)優(yōu)化校正后的距離與真實(shí)距離之間的差異。PCM的訓練與無(wú)人機檢測器的訓練是相互獨立的,在推斷過(guò)程中,PCM只需附加到無(wú)人機檢測器的末尾進(jìn)行位置校正。
本文針對無(wú)法完全校正的難樣本,提出了一種動(dòng)態(tài)迭代校正方法。通過(guò)堆疊多個(gè)位置校正模塊(PCM)來(lái)連續進(jìn)行迭代校正。為了確定是否需要進(jìn)一步校正,本文設計了一個(gè)門(mén)控機制,根據數據樣本的難度自適應調整校正過(guò)程。在訓練過(guò)程中,使用絕對相對差異(Abs Rel)作為測量指標來(lái)確定難樣本,并使用交叉熵損失函數對門(mén)控模塊的輸出進(jìn)行優(yōu)化。通過(guò)多個(gè)PCM和門(mén)控模塊的指令,可以在推斷過(guò)程中順序執行多個(gè)PCM,實(shí)現動(dòng)態(tài)迭代校正。
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。