智能語(yǔ)音助手將成為智能家居用戶(hù)入口
一、智能語(yǔ)音助手加速發(fā)展 技術(shù)驅動(dòng)是主因
智能語(yǔ)音助手成為2017年CES和MWC熱點(diǎn)之一,內置智能語(yǔ)音助手的產(chǎn)品覆蓋多個(gè)領(lǐng)域、多個(gè)品牌的多類(lèi)產(chǎn)品,例如福特汽車(chē)、惠而浦、LG等家電廠(chǎng)商的洗衣機、電冰箱、電烤箱等家用電器,LG家庭機器人和華為智能手機等,智能語(yǔ)音助手儼然成為諸多智能產(chǎn)品的核心配置。智能語(yǔ)音助手在2016年呈現了加速發(fā)展之勢,體現在以下方面:
本文引用地址:http://dyxdggzs.com/article/201710/367407.htm智能語(yǔ)音以智能家居做為切入點(diǎn)快速發(fā)展。蘋(píng)果公司早在2011年就發(fā)布了智能語(yǔ)音助手,但其快速發(fā)展是以2016年亞馬遜Alexa的快速發(fā)展為標志,一是銷(xiāo)量迅速增長(cháng)。亞馬遜旗下內置Alexa的語(yǔ)音購物助手Echo客戶(hù)滲透率已由2%提升至5%,截至2016年年底,亞馬遜共賣(mài)出600萬(wàn)臺Amazon Echo設備[1]。二是智能語(yǔ)音助手功能急速完善。Alexa在2014年最初發(fā)布時(shí)只有13個(gè)內嵌的技能,現在這項功能已經(jīng)兼容7000款應用,包括連接Uber、Twitter等應用程序。用戶(hù)可以通過(guò)Echo的語(yǔ)音識別功能,操控任何一項具有聯(lián)網(wǎng)功能的設備,比如電燈、電視、空調等等。三是生態(tài)快速擴建。2015年12月,英特爾與亞馬遜聯(lián)合宣布,雙方未來(lái)將在一系列智能家庭項目上合作,并計劃開(kāi)發(fā)一個(gè)采用英特爾芯片、搭載亞馬遜Alexa虛擬助理的智能語(yǔ)音架構。汽車(chē)生產(chǎn)商福特在本屆CES上也宣布與亞馬遜合作,未來(lái)車(chē)主將能夠在福特的車(chē)輛上體驗Alexa語(yǔ)音服務(wù),實(shí)現聲控購物、搜索導航,甚至車(chē)主在家就可以通過(guò)語(yǔ)音指令啟動(dòng)引擎、鎖定或解鎖車(chē)門(mén)。LG、GE等眾多企業(yè)都與亞馬遜達成協(xié)議,將自家產(chǎn)品內嵌Alexa。
深度學(xué)習算法助力語(yǔ)音識別技術(shù)提升是智能語(yǔ)音助手快速發(fā)展的主要原因。近兩年,深度學(xué)習算法得到快速發(fā)展,其成果率先應用于語(yǔ)音識別等領(lǐng)域,推動(dòng)其取得突破性進(jìn)展。2016年,《麻省理工科技評論》將語(yǔ)音識別和自然語(yǔ)言理解相結合,評為2016年十大突破技術(shù)。應用于語(yǔ)音識別的深度學(xué)習算法的卷積神經(jīng)網(wǎng)絡(luò )層級(CNN),從最初的8層,到19層、22層、乃至152層的網(wǎng)絡(luò )結構,而隨著(zhù)網(wǎng)絡(luò )結構的加深,語(yǔ)音識別的錯誤率也從2012年的16.4%逐步下降到3.57%[2]。許多公司的語(yǔ)音識別系統語(yǔ)音識別正確率超過(guò)90%,在很多場(chǎng)合的已經(jīng)超過(guò)人類(lèi)。
二、智能語(yǔ)音助手將成為新的用戶(hù)入口
語(yǔ)音將成為主流人機交互方式之一。語(yǔ)音交互方式將人們的雙手從觸摸屏解放出來(lái),減少人們在數據輸入上花費的時(shí)間。但語(yǔ)音交互并不適用于所有場(chǎng)景,例如公共場(chǎng)所跟手機對話(huà)是不禮貌的。這時(shí)通過(guò)屏幕交互可能比語(yǔ)音更方便。較適合語(yǔ)音應用的設備包括家居和汽車(chē),這也是亞馬遜Alexa雖然比蘋(píng)果Siri推出晚,卻能取得更快增長(cháng)的原因之一。
當前的各種智能語(yǔ)音交互助手,只是虛擬個(gè)人助理(VPA)的雛形,VPA將具備完善的私人助理功能,成為用戶(hù)連接服務(wù)的節點(diǎn),提供無(wú)所不在的服務(wù)。VPA將與眾多第三方app程序交互,用戶(hù)需要某類(lèi)服務(wù)時(shí)均可告知VPA,VPA可搜索并決定調用哪款app提供服務(wù),單獨app將從桌面移至后臺,成為VPA的一個(gè)子服務(wù);VPA還具有學(xué)習能力,根據歷史數據掌握用戶(hù)的偏好、習慣等,對用戶(hù)需求做出預判,提供符合用戶(hù)個(gè)性特點(diǎn)的不斷優(yōu)化的服務(wù)。
三、巨頭加快展開(kāi)智能語(yǔ)音助手生態(tài)布局
巨頭已悉數入場(chǎng),爭搶智能語(yǔ)音交互新入口。蘋(píng)果是發(fā)展智能語(yǔ)音助手的先鋒,于2011年在iPhone中內置了智能語(yǔ)音助手產(chǎn)品Siri。谷歌2012年發(fā)布了名為Google now的智能語(yǔ)音產(chǎn)品,并于2016年推出演進(jìn)產(chǎn)品Google Assistant。亞馬遜于2014年推出內置語(yǔ)音助手Alexa的無(wú)線(xiàn)音箱產(chǎn)品。微軟發(fā)布智能語(yǔ)音助手時(shí)間相對較晚,其智能語(yǔ)音助手產(chǎn)品Cortana于2015年與新的Windows 10操作系統一同發(fā)布。Facebook于2015年推出智能語(yǔ)音助手服務(wù)M,內置AI技術(shù),并有一個(gè)人工團隊支撐。百度也于2015年發(fā)布名為Duer的智能語(yǔ)音助手產(chǎn)品。三星2016年收購了智能語(yǔ)音助手技術(shù)公司Viv,并計劃于2017年推出相關(guān)產(chǎn)品。這些廠(chǎng)商均擁有一個(gè)主導的生態(tài),例如電子商務(wù),搜索引擎,智能手機,這些都提供了大量的數據來(lái)支撐這些具體平臺的智能語(yǔ)音助手。大量用于“學(xué)習”的數據,使得AI更有效率,使得推薦和定位更加細致入微。
亞馬遜暫時(shí)領(lǐng)先發(fā)展,未來(lái)競爭格局存在變數。亞馬遜搭載Alexa無(wú)論從銷(xiāo)量、功能、生態(tài)等方面,均領(lǐng)先于蘋(píng)果和谷歌。然而,設備仍然是智能語(yǔ)音助手成功的關(guān)鍵,智能語(yǔ)音助手需要有足夠大的設備平臺作為分發(fā)接口,提供隨時(shí)隨地、無(wú)所不在的服務(wù),隨身攜帶的手機是較為理想的硬件載體。蘋(píng)果和谷歌已經(jīng)在智能手機領(lǐng)域成功,未來(lái)可能后來(lái)居上,占據主導位置。
巨頭圍繞智能語(yǔ)音助理展開(kāi)生態(tài)布局,推動(dòng)跨平臺、跨系統的智能語(yǔ)音助手應用。廠(chǎng)商通過(guò)開(kāi)放api、與第三方app互動(dòng)等形式擴大生態(tài)建設,推動(dòng)語(yǔ)音助手在手機、家居、汽車(chē)等領(lǐng)域應用。亞馬遜采取開(kāi)放Alexa的語(yǔ)音技術(shù)供第三方開(kāi)發(fā)者免費使用。此外亞馬遜沒(méi)有對合作伙伴設置獨家合作協(xié)議,硬件制造商可以自由切換到競爭對手的語(yǔ)音助理,這也使得硬件廠(chǎng)商更樂(lè )于集成Alexa。蘋(píng)果早在2014年就發(fā)布了自家的智能家居平臺HomeKit,并不斷加強HomeKit與Siri的融合;2016年6月,蘋(píng)果宣布開(kāi)放SDK 給開(kāi)發(fā)者們,允許其他的第三方應用接入 Siri。谷歌也表示將向開(kāi)發(fā)者和第三方軟硬件開(kāi)放assistant。
當前智能語(yǔ)音助手商業(yè)模式呈現多樣化。目前較為成熟的亞馬遜的商業(yè)模式。亞馬遜的核心零售業(yè)務(wù)內置于Echo中,用戶(hù)與 Echo 的互動(dòng)會(huì )鼓勵用戶(hù)更多地去購物,而且會(huì )將更多的數據反饋給亞馬遜的推薦系統,因此網(wǎng)站和應用程序都可以再次促進(jìn)用戶(hù)購買(mǎi)更多商品。另外一種是利用智能語(yǔ)音助手實(shí)現對用戶(hù)更深層次理解,實(shí)現更精準的用戶(hù)定位。智能語(yǔ)音助手有著(zhù)用戶(hù)需求的詳細數據集,結合對物理行蹤、搜索歷史以及電子郵件和文本內容的了解,可實(shí)現更好的廣告定位,Google和Facebook等公司目前主要采取此種收入模式。
四、智能語(yǔ)音助手當前發(fā)展仍存不足
使用習慣還有待培養
根據Gartner的調查數據,用戶(hù)經(jīng)常使用智能語(yǔ)音助手的兩至三個(gè)功能—天氣、位置和日歷核對。Echo雖然擁有上千種功能,但是大部分功能用戶(hù)并不會(huì )使用,用戶(hù)使用亞馬遜Echo的最的功能是設置時(shí)間和播放歌曲,80%以上用戶(hù)使用過(guò)[3]。
市場(chǎng)碎片化
目前,市場(chǎng)上有多家廠(chǎng)商提供智能語(yǔ)音助手服務(wù),這些廠(chǎng)商與不同的設備廠(chǎng)商達成合作,形成了各自為陣的生態(tài)系統。內置智能語(yǔ)音助手的設備商,必須對現存的替代方案開(kāi)放,并與不同的服務(wù)提供商協(xié)作,才能提供便于用戶(hù)使用、尤其是跨平臺使用的服務(wù)。
隱私問(wèn)題
理想情況下,個(gè)人鑒別信息應該安全地存儲在用戶(hù)設備上,并且不會(huì )泄露給智能語(yǔ)音助手提供商或者其他服務(wù)提供商。但是實(shí)際上智能語(yǔ)音助手需要把用戶(hù)數據上傳至云端服務(wù)器,經(jīng)過(guò)計算后將結果返回到終端,涉及到云端存儲保障隱私問(wèn)題。
技術(shù)瓶頸
智能語(yǔ)音助手還存在語(yǔ)義理解方面的問(wèn)題。雖然語(yǔ)音識別技術(shù)這兩年取得了較大進(jìn)步,但理解整個(gè)對話(huà)的環(huán)境和上下文語(yǔ)義,是目前絕大部分機器學(xué)習或人工智能的瓶頸,機器還很難將詞語(yǔ)表達的意思與語(yǔ)境和情緒相結合。
五、國內與國外同步發(fā)展
一方面,語(yǔ)音識別技術(shù)與國外發(fā)展同步??拼笥嶏w在國際最高水平語(yǔ)音合成賽Blizzard Challenge 中十連冠,14、15 年兩次國際漢英翻譯大賽IWSLT 全球第一、15 年機器口語(yǔ)翻譯系統獲NIST 國際評測冠軍,在車(chē)內語(yǔ)音方面交互成功率更是超過(guò)86%,領(lǐng)先第二名高達10%[4]。
另一方面,本土智能語(yǔ)音助手相較國外產(chǎn)品具有競爭優(yōu)勢。百度是除美國公司之外,同規模公司中唯一一個(gè)運營(yíng)智能語(yǔ)音助手的。百度智能語(yǔ)音助手Duer可提供搜索信息、預定電影票、叫出租車(chē)等助理服務(wù),采用端到端的深度學(xué)習系統,有時(shí)它在識別漢語(yǔ)語(yǔ)音片段方面,要比人為識別更加準確。國內的大量人口和強勁的中國內容數據庫是Duer的競爭優(yōu)勢,相比于微軟Cortana,百度的搜索引擎數據庫更具優(yōu)勢,谷歌則至今在中國沒(méi)法使用,使得Duer成為最受中國市場(chǎng)驅動(dòng)的智能語(yǔ)音助手。Duer內置于百度安卓搜索app中,安裝在中國上百萬(wàn)手機中。百度正在致力于將Duer擴展至手機以外的其他設備,例如機器人或者家庭設備。
評論