不只有結構光:機器眼中的立體世界 還在發(fā)生若干變化
要說(shuō)AI技術(shù)里什么最火,機器視覺(jué)絕對算一個(gè);而要說(shuō)機器視覺(jué)技術(shù)里什么最火,大概毫無(wú)爭議就屬3D機器視覺(jué)了。
本文引用地址:http://dyxdggzs.com/article/201812/395780.htm所謂3D機器視覺(jué),是指在一般的機器視覺(jué)技術(shù)的基礎上,加入對立體空間中三維模型的理解。這項技術(shù)不僅涉及AI,而是一門(mén)機器視覺(jué)、圖形學(xué)與數據感知技術(shù)的交叉學(xué)科。想想也知道,讓機器認識3D畫(huà)面是非常有價(jià)值的。畢竟人的視覺(jué)理解就是3D的,想要讓AI盡量貼近真人的感知方式,3D是必須攻克的難題。
在產(chǎn)業(yè)場(chǎng)景上,3D機器視覺(jué)是無(wú)人駕駛和高精地圖的重要技術(shù)條件,在VR/AR上應用也非常廣泛,而無(wú)人機航拍與測繪也離不開(kāi)這門(mén)技術(shù)。在蘋(píng)果把3D結構光技術(shù)炒火了之后,手機中的3D機器視覺(jué)也已經(jīng)成為兵家必爭之地——假如說(shuō),這些厲害的技術(shù)都是賽車(chē),那么3D機器視覺(jué)就是他們在路上都會(huì )遇到的收費站……
今天在機器視覺(jué)頂會(huì )中,差不多會(huì )有半壁江山那么多的論文都是跟3D有關(guān)。前沿探索可謂瘋狂進(jìn)行。然而重點(diǎn)來(lái)了,關(guān)于這一領(lǐng)域,似乎大部分吃瓜群眾還是只知道一個(gè)結構光而已。
有哪些三維圖像+機器視覺(jué)的新技術(shù)趨勢,今天正隱藏在未知迷霧中眺望這個(gè)世界?今天我們來(lái)說(shuō)幾種很有科幻感的技術(shù)突破點(diǎn)。說(shuō)不定這些能力明年就會(huì )出現在你的手機、VR設備和無(wú)人機中,又或許即將成為某個(gè)被資本瘋狂親吻的創(chuàng )業(yè)熱潮。
超大場(chǎng)景的3D數據感知
3D機器視覺(jué)包括很多方面,既有讓智能體去理解3D數據,也包括如何通過(guò)機器視覺(jué)的解決方案,去獲取3D模型數據。
傳統意義上的3D數據獲取,或者稱(chēng)其為3D感知技術(shù),一般來(lái)說(shuō)可以利用多角度拍照或者深度傳感器的方式實(shí)現3D數據收集。這種技術(shù)的局限在于,收集的3D數據不能太大。
然而在3D資料要求不斷升級的今天,對于超大場(chǎng)景的3D數據感知,正在成為一個(gè)熱門(mén)議題。比如無(wú)人駕駛中使用的城市高精地圖,就可以看做一個(gè)個(gè)超大3D場(chǎng)景的拼接。智能城市領(lǐng)域運用到的很多城市數據推演,也要根植于對城市3D場(chǎng)景的收集。

機器視覺(jué)正在為超大場(chǎng)景的3D數據感知提供很多新的方法。比如自動(dòng)化的成像方法,像視覺(jué)SLAM在線(xiàn)處理連續幀的圖像,實(shí)現實(shí)時(shí)重建巨大3D場(chǎng)景。再比如說(shuō)對航拍數據進(jìn)行點(diǎn)云分割和點(diǎn)云數據的語(yǔ)義理解,幫助快速低成本獲取城市3D數據。
總體來(lái)看,今天超大場(chǎng)景的3D數據感知,有三個(gè)主要應用方向,很可能分別成為各自技術(shù)領(lǐng)域中新的投資和創(chuàng )業(yè)熱點(diǎn):
1、建筑物的3D高精度模型,運用在工程監理、智能設計、物流和智能城市領(lǐng)域。
2、高精地圖與3D數據感知的結合,這是無(wú)人駕駛的重要一環(huán)。
3、室內外一體的3D建模,這對于智能家居設計、環(huán)境監控、VR/AR體驗來(lái)說(shuō)都有重要幫助。
手機與3D視覺(jué)進(jìn)入蜜月期
3D結構光,今天已經(jīng)當之無(wú)愧成為了高端手機的標配,成為了繼雙攝、三攝與屏下指紋之后又一個(gè)手機行業(yè)爭搶的熱點(diǎn)。
然而手機上的3D視覺(jué)技術(shù)遠不止于結構光,從算法、傳感硬件,到影像系統解決方案,都可能成為手機與3D視覺(jué)進(jìn)一步耦合的關(guān)鍵因素。
今天來(lái)看,有3個(gè)相關(guān)趨勢非??赡艹蔀槊髂甑臒狳c(diǎn)。一個(gè)是基于芯片端進(jìn)行的3D視覺(jué)算法加速,這很可能成為手機AI的下一個(gè)進(jìn)化方向。第二個(gè)是高糾錯能力的3D視覺(jué)算法將會(huì )普及,在終端實(shí)現3D數據收集和本地建模將會(huì )成為新的熱點(diǎn)。第三個(gè)是后置攝像頭加入3D視覺(jué)解決方案指日可待。
從芯片端,到開(kāi)發(fā)平臺,再到數據集、傳感系統,3D機器視覺(jué)正在多個(gè)領(lǐng)域影響手機戰場(chǎng)的走向,在這些領(lǐng)域儲備技術(shù)武器,也很可能成為明年手機戰場(chǎng)廝殺的關(guān)鍵節點(diǎn)。

評論