人工智能+產(chǎn)品優(yōu)勢 百度AR或將后發(fā)制人?
二、深厚的AI技術(shù)是百度AR起航的動(dòng)力
本文引用地址:http://dyxdggzs.com/article/201608/295055.htm就在昨天,百度在其智能營(yíng)銷(xiāo)解決方案發(fā)布會(huì )上,發(fā)布了專(zhuān)為智能手機研發(fā)的AR平臺“DuSee”。在吳恩達看來(lái),DuSee是百度人工智能技術(shù)的自然延伸。該平臺使用了復雜的計算機視覺(jué)技術(shù)和深度學(xué)習,去理解場(chǎng)景,然后增強場(chǎng)景。要想研發(fā)出優(yōu)秀的AR技術(shù),就必須應用更優(yōu)的人工智能技術(shù)。
從技術(shù)環(huán)節來(lái)看,AR主要包括對現實(shí)世界的感知、真實(shí)世界和虛擬世界的信息融合、實(shí)時(shí)交互三個(gè)方面。DuSee是在百度大腦的基礎上發(fā)展起來(lái)的平臺。百度大腦利用Paddle深度學(xué)習并行計算平臺,在百度的GPU集群上訓練上千億級數據樣本。整個(gè)百度大腦有上萬(wàn)億的參數,是全球最大的神經(jīng)網(wǎng)絡(luò ),在圖像識別、語(yǔ)音交互等方向世界領(lǐng)先。利用百度大腦的技術(shù)和計算能力,百度AR技術(shù)在物體識別、三維環(huán)境感知、人機交互等核心方向建立了絕對優(yōu)勢。
首先,深度學(xué)習在圖像識別和物體識別方面準確率的大幅提升可以幫助設備更好的感知世界。物體識別是AR的基礎功能。通過(guò)攝像頭識別場(chǎng)景中的物體,能夠觸發(fā)相關(guān)的AR,并且在數據庫中找到相應的虛擬物體與信息。目前,百度的圖像識別能力已經(jīng)排名世界第一,達到了四萬(wàn)個(gè)物體種類(lèi)的識別。同時(shí),百度在大規模圖片檢索、商品垂類(lèi)識別、人臉識別和OCR識別等技術(shù)方面也是出于世界領(lǐng)先水平。
其次,在信息融合方面,人工智能技術(shù)也會(huì )帶來(lái)更加智能的定位和追蹤功能,以及更加出色的圖像渲染。百度的雙目視覺(jué)里程計技術(shù)在KITTI數據集上多項指標位列前三位。百度自主研發(fā)的相機追蹤算法能夠為AR應用提供快速穩定的相機姿態(tài)估計結果,算法速度和準確度都處于業(yè)內領(lǐng)先水平。算法同時(shí)具備輕量,內存消耗低以及對相機對焦準確度要求寬松等技術(shù)優(yōu)勢,極好的適應了AR技術(shù)在移動(dòng)設備上的要求。同時(shí)在三維視覺(jué)的其它基礎技術(shù)領(lǐng)域也進(jìn)行了積極的布局和積累。比如在基于圖像的室內定位,雙目視覺(jué)里程計,基于立體相機的景深感知,基于RGB-D相機的室內大規模重建等方向都取得了世界級的成果。相關(guān)研究成果被世界計算機視覺(jué)領(lǐng)域頂級會(huì )議如ICCV,CVPR錄用,多項技術(shù)已經(jīng)應用到百度的無(wú)人車(chē)項目中。
百度自主開(kāi)發(fā)的跨平臺三維渲染引擎,除了傳統引擎的渲染功能,側重于虛擬物體和現實(shí)環(huán)境的融合,包括動(dòng)態(tài)真實(shí)環(huán)境的識別、實(shí)時(shí)三維圖形的生成渲染、虛實(shí)混合中的光照一致性和虛實(shí)物體相互作用的一致性構建上
最后,在A(yíng)R下,人和機器會(huì )出現一種有史以來(lái)最為自然的交互方式,人工智能在手勢識別、語(yǔ)音識別和自然對話(huà)方面的成績(jì)會(huì )成為這種自然交互的基礎,而且近期在做多模識別,比如說(shuō)基于自然語(yǔ)言處理和圖像的imagecaption也會(huì )和AR的交互場(chǎng)景完美的匹配起來(lái)。百度利用深度神經(jīng)網(wǎng)絡(luò )和大量數據,語(yǔ)音識別能力在嘈雜環(huán)境和各種方言等條件下保持非常高的識別率。
人工智能技術(shù)只是為AR提供基礎技術(shù),而真正讓AR落地,重塑人、信息和物理世界三者之間關(guān)系的終極目標還需要豐富的產(chǎn)品和應用來(lái)延伸至用戶(hù)。斯坦福大學(xué)的電氣工程助理教授GordonWetzstein說(shuō):「AR真的可以無(wú)縫地集成到日常生活之中:例如溝通、工作、信息可視化、戶(hù)外游戲等等,在幾乎任何你能想出的各個(gè)領(lǐng)域……這將從根本上改變人與人交流的方式?!?/p>
三、豐富的產(chǎn)品將助力百度AR迅速落地
百度在A(yíng)R領(lǐng)域的優(yōu)勢除了在基礎技術(shù)人工智能方面的強大儲備之外,其次是還擁有搜索、地圖、無(wú)人車(chē)等天然與AR產(chǎn)生聯(lián)系的豐富的產(chǎn)品線(xiàn)。
首先,百度在搜索方面的優(yōu)勢毋庸置疑,而用戶(hù)搜索的目的基本可以分成幾類(lèi),1)獲取知識;2)掌握技能,借助AR,一個(gè)醫學(xué)院的學(xué)生可以直接搜到3D可互動(dòng)的人體結構;家庭用戶(hù)在搜索「如何給空氣凈化器更換濾芯」時(shí),也可以借助更加直觀(guān)的AR效果來(lái)解決現實(shí)生活的問(wèn)題。因此,百度可以將AR效果集成到搜索中以提升用戶(hù)體驗。
其次,AR是用戶(hù)真實(shí)世界和信息世界的疊加,真實(shí)世界就涉及用戶(hù)的移動(dòng)和位置,因此,地圖和LBS服務(wù)就顯得尤為重要了,這個(gè)大家從火爆的AR游戲
此外,百度的其他產(chǎn)品也將與AR結合起來(lái),比如手機百度、百度糯米等多個(gè)用戶(hù)體量過(guò)億的產(chǎn)品,總之,百度在A(yíng)R的應用方面還是有著(zhù)充分的想象空間。
百度基于人工智能底層技術(shù)和多種移動(dòng)產(chǎn)品的兩端優(yōu)勢,未來(lái)的AR布局值得期待。
評論