Google 解釋 Pixel 4 手勢雷達背后的技術(shù)
Soli 動(dòng)作感應系統是 Pixel 4 系列的一大賣(mài)點(diǎn),理論上它可以快速地識別用戶(hù)手勢然后執行相應的操作。不過(guò)這套方案背后的工作原理可能未必如許多人所想像,而在日前發(fā)布的一篇博客中 Google 專(zhuān)門(mén)對此進(jìn)行了一番解釋。
本文引用地址:http://dyxdggzs.com/article/202003/410935.htm首先,Soli 的短距離雷達主要是被用來(lái)做兩件事,其一是探測到人的存在從而讓面部辨識組件迅速做好掃描人臉的準備,其二則是認清滑動(dòng)之類(lèi)的隔空手勢。這第二項是體現 Soli 功能性的核心,而為了讓相關(guān)組件小到可以被塞進(jìn)手機,Google 在雷達識別傾向上的優(yōu)先級是將動(dòng)作放在形狀前面的。
這種做法還帶來(lái)了一項額外的好處,那就是 Soli 相對來(lái)說(shuō)不容易對用戶(hù)的隱私構成侵犯。因為它沒(méi)有辦法記錄清楚的圖像,因此 Google 就「沒(méi)有足以辨別出人臉或身體的照片可供利用」了。而為了能在各種使用場(chǎng)景下更快更準確地捕捉使用者一閃而過(guò)的動(dòng)作,Soli 是以一種 3D 視圖的方式來(lái)觀(guān)察周?chē)氖澜?。如下圖所示,它會(huì )用縱軸來(lái)代表對象的距離,同時(shí)以橫軸來(lái)代表對象靠近或遠離手機的速度。而每個(gè)像素的亮度反映的是探測對象的相對尺寸,下圖左中右分別是用戶(hù)走近設備、用手伸向設備和在設備上方做滑動(dòng)動(dòng)作時(shí) Soli 看到的景象。
Google 以此為基礎建立了 AI 模型,并招募了大量志愿者結合 TensorFlow 機器學(xué)習框架來(lái)幫助 Soli 進(jìn)行手勢識別的訓練。由此得來(lái)的成果還需要經(jīng)過(guò)專(zhuān)門(mén)的優(yōu)化,最終才能依靠 Pixel 4 定制的低功耗 DSP 直接在手機上加以運用。雖然就目前的情況來(lái)看,Soli 還只能認出一些相對簡(jiǎn)單的動(dòng)作,但在 Google 眼中這項技術(shù)未來(lái)還有相當大的潛力可挖。他們相信 Soli 日后也有望被整合到諸如智能手表這樣尺寸更小,因而更適合通過(guò)手勢來(lái)操作的設備之中,另外在安全、娛樂(lè )、教育等領(lǐng)域它或許也能起到更多的作用。
評論