語(yǔ)音交互領(lǐng)域 亞馬遜與京東必有一戰?
很多今年去了美國CES的人都有類(lèi)似的感受,無(wú)人機和VR的熱度略減,智能設備的亮點(diǎn)乏善可陳。人工智能的應用和產(chǎn)品并沒(méi)有超出去年初的期待值,而在熱點(diǎn)缺缺的CES2017上,一款“舊”應用亞馬遜Alexa成為了為數不多的話(huà)題。
本文引用地址:http://dyxdggzs.com/article/201702/343418.htm作為Amazon的AI語(yǔ)音助理系統,Alexa+Echo的組合,在2014年11月,亞馬遜非常低調的推出了這套聲控兄弟組合。而在推出超過(guò)半年之后,智能揚聲器Echo才得以在市場(chǎng)上進(jìn)行銷(xiāo)售。
有趣的是,與亞馬遜對Echo的低調不同,媒體和業(yè)界卻對這個(gè)產(chǎn)品給予了相當大的關(guān)注。因為Alexa與越來(lái)越多的應用和設備互聯(lián),在人工智能火熱的大背景下,Echo搖身一變成為了智能家庭助手的新入口。
實(shí)際上,Echo并非在唱獨角戲,京東叮咚(DingDong)智能音箱和谷歌Google Home都在智能家庭助手的角度,先后對Echo造成了擠壓。那么,在三強鼎立的市場(chǎng)背景下,語(yǔ)音交互的格局要如何定義?Echo模式有沒(méi)有機會(huì )產(chǎn)生下一個(gè)巨頭?Echo在中國市場(chǎng),有沒(méi)有走出來(lái)的可能?

語(yǔ)音交互注定是巨頭的游戲?
不談Echo這樣的智能入口模式,先來(lái)看看語(yǔ)音交互的商業(yè)模式。
其實(shí),科技巨頭們對語(yǔ)音交互早就有了明確的判斷。很早以前,比爾·蓋茨在美國卡內基-梅隆大學(xué)發(fā)表演講時(shí)表示,語(yǔ)音技術(shù)等自然交互技術(shù)在不久的將來(lái)會(huì )成為智能硬件的重要功能。他認為,未來(lái)幾年,互聯(lián)網(wǎng)搜索將更多通過(guò)語(yǔ)音命令來(lái)完成,而不僅僅是語(yǔ)音識別。從簡(jiǎn)單的語(yǔ)音識別到智能化的人機語(yǔ)音交互,是語(yǔ)音技術(shù)未來(lái)發(fā)展的關(guān)鍵。這也許就是微軟之所以會(huì )投入“小冰”的最初背景。
同樣,喬布斯在世當初也已經(jīng)認識到了“觸控”這種人機交互方式的局限性。所在在2010年iPhone 4搭載Siri橫空出世,喬布斯希望以此開(kāi)啟人工語(yǔ)音智能的人機交互革命。然而,當時(shí)的Siri只能做到取悅用戶(hù),發(fā)布僅僅數月后,絕大部分用戶(hù)對Siri功能失去新鮮感。
必須承認,在“解放雙手”這個(gè)層面上,人工語(yǔ)音智能在與人的交互上應該做到無(wú)需上手,只需要簡(jiǎn)潔的語(yǔ)音口令就實(shí)現絕大多數的手機使用場(chǎng)景,這是語(yǔ)音交互的迷人之處。
問(wèn)題是,通過(guò)一個(gè)什么樣的設備作為語(yǔ)音交互的入口才是最合理的。是智能手機嗎?我認為手機不失為一個(gè)好的入口,但智能手機與用戶(hù)的近距離,以及觸控的便利性,很難讓語(yǔ)音交互得到更好的應用場(chǎng)景。所以,一個(gè)像“音箱”這樣的入口,開(kāi)始顯示出它在家庭助手角度的光芒。
所以,Echo,京東叮咚(DingDong)智能音箱和谷歌Google Home來(lái)了。
前幾天看到一篇文章《中國Echo能以小米模式復制成功?》在分析Echo模式能不能誕生一個(gè)小米那樣的公司,得出的結論是很難。我認為,這個(gè)分析的立足點(diǎn)本身就有存在很大的漏洞。第一,智能語(yǔ)音交互設備,絕不是手機一樣的通用產(chǎn)品,所以很難取得快速的市場(chǎng)效應,這對創(chuàng )業(yè)型公司是很大的壓力。第二,智能語(yǔ)音交互是一個(gè)成長(cháng)中的生態(tài),而手機建立在安卓的體系下,并不需要對生態(tài)的成熟等太久。
所以,在我看來(lái)。智能語(yǔ)音交互的成功,一定是需要巨頭級的科技公司的。第一,這需要對技術(shù)的持續投入,語(yǔ)音交互技術(shù)本身是一個(gè)重要因素,而背后的人工智能技術(shù)、大數據分析和應用場(chǎng)景的創(chuàng )新每一環(huán)都必不可少。第二,語(yǔ)音交互之后,則是各種設備和應用的聯(lián)接,這種聯(lián)接的背后就是生態(tài)的成熟,從目前成功的模式看,能夠最終提供聯(lián)接的也會(huì )是一個(gè)大公司。
所以,我相信,智能語(yǔ)音交互的未來(lái),始終離不開(kāi)巨頭公司的身影,亞馬遜,谷歌,微軟和京東都會(huì )是其中有競爭力的玩家。
從場(chǎng)景看語(yǔ)音交互的未來(lái)格局
從市場(chǎng)上看,目前定位最接近的智能語(yǔ)音交互的產(chǎn)品應該有三個(gè),分別是亞馬遜的Echo,谷歌的Google Home,和京東的叮咚(DingDong)智能音箱。
首先,從推出時(shí)間來(lái)看,Echo最早,是2014年底推出的。京東的叮咚(DingDong)智能音箱在2015年5月的CES上推出,時(shí)間上比Echo正式上市銷(xiāo)售的時(shí)間要早。最晚推出的是Google Home,在2016年5月的I/O開(kāi)發(fā)者大會(huì )上推出。
但如果從應用的場(chǎng)景擴展來(lái)講,推出Echo的亞馬遜和推出叮咚(DingDong)智能音箱的京東,在企業(yè)基因和利用語(yǔ)音交互優(yōu)化電商的入口看,它們要比Google Home更有成功的機會(huì )。相比而言,面向智能家居聯(lián)接的Google Home,并沒(méi)有超出“家居”的概念本身。
所以說(shuō),Echo和叮咚(DingDong)智能音箱在未來(lái)必有一戰,并不夸張。
去年的CES,叮咚(DingDong)智能音箱登陸拉斯維加斯,并與JBL簽署合作協(xié)議,利用JD+智能音頻解決方案,越來(lái)越多的音箱企業(yè)通過(guò)JD+智能音頻聯(lián)盟,步入到新的行業(yè)。。
今年1月的Alexa之所以在CES備受關(guān)注,是因為Alexa與福特、華為、LG,以及多家創(chuàng )業(yè)公司均推出集成Alexa的家電、手機、汽車(chē),以及其他數碼產(chǎn)品。讓業(yè)界看到了Alexa在未來(lái)生態(tài)的拓展初見(jiàn)規模。
實(shí)際上,叮咚(DingDong)智能音箱在生態(tài)拓展上也非常成功,在2016年6月,叮咚(DingDong)開(kāi)放平臺的發(fā)布,已經(jīng)吸引了滴滴和e袋洗等企業(yè)加入叮咚(DingDong)音箱的智能生態(tài)。2016年10月,京東智能云語(yǔ)音服務(wù)開(kāi)放平臺上線(xiàn),用戶(hù)可通過(guò)叮咚呼叫第三方服務(wù),叮咚的家庭入口布局也真正完成了從交互到內容到服務(wù)的全面布局,也迎來(lái)了美的和小天鵝等硬件廠(chǎng)家的加入。
目前看,無(wú)論是叮咚(DingDong)智能音箱還是Echo,都處于市場(chǎng)的培育階段。Echo從上市以來(lái),500萬(wàn)臺的銷(xiāo)量并不算驚艷,而叮咚(DingDong)智能音箱在中國市場(chǎng)的業(yè)績(jì)增長(cháng)也足以媲美面向全球的Echo,在京東平臺上,目前叮咚智能音箱已經(jīng)成為wifi類(lèi)音箱品類(lèi)銷(xiāo)量第一。最后還有谷歌,當初斥資32億美元收購了智能家居設備制造商Nest。盡管時(shí)至今日,Nest的發(fā)展不盡人意,但這對未來(lái)Google Home的發(fā)展也許會(huì )多了一些底氣。
中國市場(chǎng),必有一戰的Echo和DingDong
首先從產(chǎn)品的對比而言,Echo的特點(diǎn)在于:圍繞語(yǔ)音交互設計的產(chǎn)品,定位于家庭的應用場(chǎng)景,并通過(guò)開(kāi)放系統,為產(chǎn)品贏(yíng)來(lái)源源不斷的第三方服務(wù)。
從技術(shù)上,亞馬遜設計了一個(gè)名為“ARS”的自動(dòng)語(yǔ)音識別處理系統。ARS由七個(gè)麥克風(fēng)和一個(gè)音頻信號過(guò)濾系統構成。七個(gè)麥克風(fēng)組成的列陣能讓Echo捕捉到環(huán)境中的細微聲音,音頻信號過(guò)濾系統過(guò)濾掉環(huán)境噪音,從而辨別出人聲。使用ARS后,即使用戶(hù)在25英尺(7.62米)之外發(fā)出命令,Echo也能夠準確識別。
而叮咚(DingDong)智能音箱,同樣是圍繞語(yǔ)音交互而設計,但是應用的場(chǎng)景要更廣闊。為什么呢?因為中國是全球互聯(lián)網(wǎng)發(fā)展最快的地區,例如O2O這種模式也僅有中國能夠走得通,這讓叮咚(DingDong)智能音箱的應用場(chǎng)景變得更多。
技術(shù)上,負責設計叮咚(DingDong)智能音箱的靈隆科技,是京東和科大訊飛兩家公司合資而來(lái)。所以它不僅基于科大訊飛的語(yǔ)音識別技術(shù),比如遠場(chǎng)識別技術(shù)和多輪對話(huà)能力。還包含了京東大數據對交互的分析能力。
其次,語(yǔ)音交互作為人工智能當中最重要的組成部分,也是需要大量的數據來(lái)進(jìn)行學(xué)習。這也是為什么,我們發(fā)現很多的語(yǔ)音交互軟件很難識別方言。所以,Echo是英語(yǔ)世界目前最合適的語(yǔ)音交互設備,而叮咚(DingDong)智能音箱則對中文語(yǔ)境更有競爭力。
這對于快速發(fā)展中的中國市場(chǎng)而言,也許根本等不到Echo的到來(lái),就會(huì )令它失去切入競爭的機會(huì )。如今,叮咚助手服務(wù)已經(jīng)接入百度音樂(lè )/喜馬拉雅、京東購物、互動(dòng)百科、E袋洗、有道筆記、JIMI、環(huán)境寶、中通快遞、中華萬(wàn)年歷/中國天氣通等內容端。這也從側面證明了叮咚(DingDong)智能音箱在中國市場(chǎng)目前所處的領(lǐng)先地位。
最后,無(wú)論是亞馬遜還是京東,他們的業(yè)務(wù)主體還是電商,所以他們最優(yōu)的應用場(chǎng)景還在于購物的環(huán)節。換句話(huà)說(shuō),未來(lái)看Echo和叮咚(DingDong)智能音箱的競爭力,可以先從兩者對購物場(chǎng)景的接入能力開(kāi)始。不久前,京東剛剛推出了基于叮咚(DingDong)音箱的語(yǔ)音購物,而亞馬遜則是在2015年5月推出了語(yǔ)音購物,所以在電商的真正戰場(chǎng)上,兩大智能語(yǔ)音交互平臺的對決,才剛剛開(kāi)始。
評論