3D手勢識別背后的技術(shù)
3D 視覺(jué)技術(shù)的比較
不同的應用或市場(chǎng)適用于不同的 3D 視覺(jué)技術(shù)。圖 1 顯示了不同 3D 視覺(jué)技術(shù)的比較及其相關(guān)響應時(shí)間、軟件復雜性、成本及準確性的相對優(yōu)缺點(diǎn)。
立體視覺(jué)技術(shù)需要極高的軟件復雜性才能獲得高精度 3D 深度數據,其通??赏ㄟ^(guò)數字信號處理器 (DSP) 或多內核標量處理器進(jìn)行處理。立體視覺(jué)系統支持小巧的外形與低成本,是移動(dòng)電話(huà)等消費類(lèi)設備的良好選擇。不過(guò),立體視覺(jué)系統的精確度與響應時(shí)間不及其它技術(shù),因此對于制造質(zhì)量控制系統等要求高精度的系統來(lái)說(shuō)不太理想。
結構光技術(shù)是包括 3D 計算機輔助設計 (CAD) 系統在內的 3D 對象掃描的良好解決方案。這些系統的相關(guān)軟件復雜性可通過(guò)硬接線(xiàn)邏輯解決(如 ASIC 與 FPGA 等),其需要高昂的開(kāi)發(fā)及材料成本。此外,該計算復雜性還可導致較慢的響應時(shí)間。在實(shí)現微觀(guān)層面上的高精度方面,結構光模式技術(shù)優(yōu)于其它 3D 視覺(jué)技術(shù)。
TOF 系統取得了性能與成本的平衡,非常適用于需要快速響應時(shí)間的制造與消費類(lèi)電子設備等應用領(lǐng)域的設備控制。TOF 系統軟件復雜程度通常較低,不過(guò)這些系統需要昂貴的照明部件(LED、激光二極管)以及高速接口相關(guān)部件(快速 ADC、快速串行/并行接口、快速 PWM 驅動(dòng)器),這將提升材料成本。圖 1 顯示了這三種 3D 傳感器技術(shù)的對比情況。
“z”(深度)如何影響人機界面
隨著(zhù)“z”坐標的加入,顯示與影像更接近自然,更貼近人類(lèi)。人們在顯示屏上能看到人眼從周邊環(huán)境所看到的逼真事物。增加這第三維坐標改變了可使用的顯示與應用類(lèi)型。
顯示
立體顯示屏
立體顯示屏通常需要用戶(hù)佩戴 3D 眼鏡。這種顯示屏為左右眼提供不同的影像,兩眼看到的影像不同,讓大腦誤以為看到了 3D 影像。這種顯示屏目前廣泛用于眾多 3D 電視與 3D 電影院。
多視點(diǎn)顯示屏
多視點(diǎn)顯視屏不同于立體顯示屏,無(wú)需佩戴特殊眼鏡。這些顯示屏可同時(shí)投射多個(gè)影像,每個(gè)影像稍微有些位移,形成適當的角度,讓用戶(hù)可在每個(gè)視點(diǎn)角度看到相同對象的不同投射影像。這些顯示屏支持全息攝影效果,在不久的將來(lái)將實(shí)現全新的 3D 體驗。
檢測與應用
處理并顯示“z”坐標的功能將實(shí)現全新的應用,其中包括游戲、制造控制、安全、互動(dòng)數字標牌、遠程醫療、汽車(chē)以及機器人視覺(jué)等。圖 2 是身體骨架與深度映射傳感技術(shù)所支持的某些應用領(lǐng)域視圖。
人類(lèi)手勢識別(消費類(lèi))
人類(lèi)手勢識別是一項深受歡迎的新技術(shù),可為游戲、消費類(lèi)以及移動(dòng)產(chǎn)品帶來(lái)新的輸入方式。用戶(hù)能夠以極其自然、直觀(guān)的方法與設備進(jìn)行互動(dòng),從而可促進(jìn)產(chǎn)品推廣。這些人類(lèi)手勢識別產(chǎn)品包括從 160 x 120 像素到 640 x 480 像素,30 到 60 fps 的各種分辨率的 3D 數據。原始數據到z深度解析、雙手跟蹤以及全身跟蹤等軟件模塊需要數字信號處理器 (DSP) 對 3D 數據進(jìn)行高效快速處理,才能實(shí)現實(shí)時(shí)游戲與跟蹤。
工業(yè)
工業(yè)與制造傳感器等大多數 3D 視覺(jué)工業(yè)應用都采用至少 1 像素至數 100k 像素的影像系統。3D 影像可使用 DSP 技術(shù)進(jìn)行控制分析,確定制造瑕疵或者從部件集中選擇正確的部件。
互動(dòng)數字標牌(精確定位的市場(chǎng)營(yíng)銷(xiāo)工具)
每天我們都在遭受廣告的轟炸,無(wú)論是看電視、開(kāi)車(chē)還是在機場(chǎng)登機都是如此。有了互動(dòng)數字標牌,企業(yè)就可通過(guò)精確定位的市場(chǎng)營(yíng)銷(xiāo)工具提供適合每位消費者的內容。例如,有人走過(guò)一個(gè)數字標牌,標牌上可能就會(huì )馬上顯示額外的消息確認該客戶(hù)。如果客戶(hù)停下來(lái)閱讀信息,該標牌可能會(huì )理解為客戶(hù)對產(chǎn)品感興趣,并提供更有針對性的消息。麥克風(fēng)則將讓廣告牌檢測并識別關(guān)鍵短語(yǔ),進(jìn)一步精確定位所提供的消息。
這些互動(dòng)數字標牌系統將需要 3D 傳感器進(jìn)行全面的身體跟蹤,2D 傳感器進(jìn)行面部識別,并需要麥克風(fēng)進(jìn)行語(yǔ)音識別。這些系統的軟件將運行在更高級的 DSP 及通用處理器 (GPP) 上,不但可實(shí)現面部識別、全面的身體跟蹤以及 Flash 媒體播放器等應用,而且還可提供諸如 MPEG4 視頻解碼等功能。
醫療(無(wú)故障虛擬/遠程護理)
3D 視覺(jué)將為醫療領(lǐng)域帶來(lái)前所未有的全新應用。醫生無(wú)需跟患者共處一室就可問(wèn)診。遠程虛擬護理采用高精度 3D 傳感器支持的醫學(xué)機器人視覺(jué)系統,可確保為每一位患者提供最優(yōu)質(zhì)的醫療護理,無(wú)論他們身處何方。
評論