解讀無(wú)人駕駛發(fā)展難點(diǎn)及現階段技術(shù)手段
雙目系統的缺點(diǎn)在于:計算量非常大,對計算單元的性能要求非常高,這使得產(chǎn)品化、小型化的難度較大。所以在芯片或FPGA上解決雙目的計算問(wèn)題難度比較大。
國際上使用雙目的研究機構或廠(chǎng)商,絕大多數是使用服務(wù)器來(lái)進(jìn)行圖像處理與計算的;也有部分將算法進(jìn)行簡(jiǎn)化后,使用FPGA進(jìn)行處理,但雙目配準的效果又收到較大程度影響,存在很多噪點(diǎn)與空洞,這對后續的計算不利,存在安全風(fēng)險。
目前,中科慧眼技術(shù)團隊實(shí)現了在芯片中對雙目的高速計算,算法一方面要保證無(wú)噪點(diǎn)、空洞的干擾,另一方面要反映出細小障礙物的存在,在這個(gè)前提下將芯片計算效率提升至15fps。

上圖為實(shí)際場(chǎng)景與計算得到的距離的對應關(guān)系(不同飽和度顏色代表不同距離,從暖色調至冷色調為距離由近及遠)。從右圖可以看出,距離計算的二維圖像中,噪點(diǎn)與空洞被很好的抑制。色調(距離)的過(guò)渡是平滑過(guò)渡,沒(méi)有跳變。
中科慧眼的雙目方案和國際上其他方案對相同高速公路實(shí)測對比結果如下圖所示:

雙目攝像頭的計算原理:

上圖中的人和椰子樹(shù),人在前,椰子樹(shù)在后,最下方是雙目相機中的成像??梢钥闯鲇覀认鄼C成像中人在樹(shù)的左側,左側相機成像中人在樹(shù)的右側,這是因為雙目的角度不一樣。再通過(guò)對比兩幅圖像就可以知道樹(shù)的視差小而人的視差大,因為樹(shù)的距離遠,人的距離近。這就是雙目三角測距的原理。
離攝像頭遠的物體在雙目圖像中的disparity小,離攝像頭遠近的物體disparity大。如果距離無(wú)限遠,雙目幾乎是沒(méi)有差別的。所以國際上大多數雙目系統的基線(xiàn)距離是十幾厘米,和人眼的距離是相近的。雙目系統可以實(shí)時(shí)把拍攝到的內容轉化成距離。ADAS一個(gè)很重要的作用是碰撞預警。碰撞預警需要關(guān)注距離的變化,需要估計即將碰撞的時(shí)間。有了距離測量,才會(huì )有距離變化,有距離變化才會(huì )有碰撞時(shí)間的估計,最后才會(huì )有預警。
算法這里只講概念,國際上有兩種主流算法。一個(gè)叫ELAS,一個(gè)叫SGBM。這兩個(gè)算法是公開(kāi)的。
我們的雙目方案相比傳統的算法具有如下優(yōu)勢:
一是效率,在芯片上的效率達到15fps,在FPGA+ARM架構上的效率可以達到40fps。
二是效果,就是對于小障礙物的識別。既要做到?jīng)]有雜點(diǎn)和空洞,又要表現細節。否則小的障礙物,比如一條橫著(zhù)的欄桿就無(wú)法識別,增加駕駛的風(fēng)險。下面的圖表現的是小物體和行人的探測上中科慧眼雙目方案與國際上其他算法的對比。


(Our為中科慧眼算法效果、其它為國際流行傳統方法的處理效果)
四、大規模產(chǎn)品化自動(dòng)駕駛路還很長(cháng)
國際上有Google,豐田等公司研制的無(wú)人駕駛汽車(chē)進(jìn)行了大量的路測,在國際上具有較大的影響力。他們使用的是“全副武裝”的雷達陣列+攝像頭的模式,是一種側重于技術(shù)積累、品牌傳播、前瞻性研究的方式。計算核心使用的是位于車(chē)輛后備箱中的計算機陣列或服務(wù)器。僅僅車(chē)頂上方的velodyne多線(xiàn)激光雷達就高達數十萬(wàn)元。而這種方式去實(shí)現無(wú)人駕駛無(wú)論從成本、體積、便捷性等方面考量,都尚不具備大規模普及與推廣的條件。國內也有很多十余家團隊目前在做本地化的自動(dòng)駕駛系統研發(fā),像中科慧眼的雙目產(chǎn)品樣機已經(jīng)完成,正在進(jìn)行大規模路測。從產(chǎn)品理論技術(shù)原型走到真正被用戶(hù)接受的產(chǎn)品,恐怕要有很長(cháng)的路要走。
評論