全球智能語(yǔ)音市場(chǎng)將達200億美元
在大數據、移動(dòng)互聯(lián)網(wǎng)、云計算以及其他技術(shù)的推動(dòng)下,全球的智能語(yǔ)音產(chǎn)業(yè)已經(jīng)步入應用的快速增長(cháng)期。
本文引用地址:http://dyxdggzs.com/article/201605/291295.htm2010年前后,科技巨頭,例如谷歌、微軟和蘋(píng)果、科大訊飛紛紛強化在語(yǔ)音市場(chǎng)上的參與,全球的語(yǔ)音市場(chǎng)逐漸從一家獨大發(fā)展成為競爭市場(chǎng),雖然從整體上看,該市場(chǎng)依然被巨頭牢牢把控。數據顯示,2015年,語(yǔ)音識別領(lǐng)頭羊公司Nuance依然牢牢占據著(zhù)市場(chǎng)份額第一的寶座,占有率為31.1%,但是已經(jīng)呈現出明顯的下滑趨勢。而谷歌、微軟、蘋(píng)果和科大訊飛則獲得了迅速的增長(cháng),全球市場(chǎng)份額分別為20.7%、13.4%、12.9%和6.7%。
中國智能語(yǔ)音產(chǎn)業(yè)獲得了前所未有的發(fā)展。ResearchandMarkets估算認為,2015年,中國的語(yǔ)音市場(chǎng)規模為46.8億人民幣,比前一年增長(cháng)53.1%,占世界的12%。
根據中國工業(yè)和信息化部電子科技信息情報研究所數據顯示,2013年,全球智能語(yǔ)音產(chǎn)業(yè)規模整體達33.7億美元,同比增長(cháng)38.1%;2014年較2013年同比增長(cháng)41.0%,產(chǎn)業(yè)規模大幅提升。預計到2017年,全球智能語(yǔ)音產(chǎn)業(yè)規模將達112.4億美元,復合年均增長(cháng)率達35.1%。

語(yǔ)音產(chǎn)業(yè)從最初的萌芽到技術(shù)突破,再到產(chǎn)業(yè)化階段以及目前的快速應用階段,已經(jīng)形成了相當成熟的產(chǎn)業(yè)。簡(jiǎn)單看來(lái),世界智能語(yǔ)音產(chǎn)業(yè)發(fā)展歷程可分為四個(gè)階段:
第一階段是技術(shù)萌芽階段(20世紀50~70年代),以孤立詞和少詞匯量句子識別,并通過(guò)關(guān)鍵詞匹配實(shí)現簡(jiǎn)單命令操作為主要內容,AT&T貝爾實(shí)驗室開(kāi)發(fā)的Audrey語(yǔ)音識別系統是其主要標志。Audrey能夠通過(guò)跟蹤語(yǔ)音中的共振峰,識別10個(gè)英文數字,正確率高達98%。
第二階段是技術(shù)突破階段(20世紀80年代),語(yǔ)音識別和自然語(yǔ)言處理技術(shù)有了較大進(jìn)展。智能語(yǔ)音技術(shù)研究由傳統的基于標準模板匹配的技術(shù)思路開(kāi)始轉向基于統計模型(HMM)的技術(shù)思路,并再次提出了將神經(jīng)網(wǎng)絡(luò )技術(shù)引入語(yǔ)音識別問(wèn)題的技術(shù)思路。
第三階段是產(chǎn)業(yè)化階段(20世紀90年代到21世紀初),智能語(yǔ)音技術(shù)由研究走向實(shí)用并開(kāi)始產(chǎn)業(yè)化,以1997年IBM推出的ViaVoice為重要標志。自此,智能語(yǔ)音產(chǎn)品開(kāi)始進(jìn)入呼叫中心、家電、汽車(chē)等各個(gè)領(lǐng)域。比如,上世紀70年代由美國國防部遠景研究計劃局資助的,旨在支持語(yǔ)言理解系統的研究開(kāi)發(fā)工作的計劃DARPA,進(jìn)入90年代后,研究重點(diǎn)已轉向識別裝置中的自然語(yǔ)言處理部分,識別任務(wù)設定為“航空旅行信息檢索”。
第四個(gè)階段是快速應用階段(2010年以后),以蘋(píng)果Siri的發(fā)布為重要引爆點(diǎn),智能語(yǔ)音應用領(lǐng)域由傳統行業(yè)開(kāi)始向移動(dòng)互聯(lián)網(wǎng)等新興領(lǐng)域延伸。在一些發(fā)達國家,大量的語(yǔ)音識別產(chǎn)品已經(jīng)進(jìn)入市場(chǎng)和服務(wù)領(lǐng)域并取得很好的效果。
快速應用階段打開(kāi)了市場(chǎng)的大門(mén),消費者也可以看到琳瑯滿(mǎn)目的產(chǎn)品出現,而隨著(zhù)其他技術(shù)的發(fā)展,比如近年來(lái)全面開(kāi)花的眾多人工智能技術(shù)不斷獲得突破,語(yǔ)音技術(shù)的市場(chǎng)發(fā)展潛力也在進(jìn)一步擴大。
高級的智能呼喚高級的語(yǔ)音
不難看到,語(yǔ)音技術(shù)在人工智能的發(fā)展中占有絕對重要的地位,它既是機器輸出語(yǔ)言,也就是“說(shuō)話(huà)”的前提,也是機器輸入,也就是“聽(tīng)”的保證。簡(jiǎn)單地說(shuō),前者設計語(yǔ)音合成后者涉及語(yǔ)音識別,這都是智能語(yǔ)音的關(guān)鍵技術(shù)。
舉例來(lái)說(shuō),在科技領(lǐng)域,聊天機器人時(shí)下是一個(gè)火熱的話(huà)題,國外很多科技媒體都預言,聊天機器人大有取代App乃至取代搜索成為互聯(lián)網(wǎng)入口之勢。至少亞馬遜的Echo發(fā)布一年多便占領(lǐng)了語(yǔ)音控制智能家居的入口。同時(shí),Facebook力推Messenger,谷歌也要憑借其強大的人工智能技術(shù)推出一款結合搜索的智能助理,微軟有定位于專(zhuān)用商務(wù)助理的Cortana,IBM的Waston積蓄已久,在醫療、環(huán)境、能源等行業(yè)都有動(dòng)作。

微軟聊天機器人Cortana
谷歌、Facebook、微軟、IBM等國外企業(yè)正在積極推進(jìn)智能語(yǔ)音技術(shù)的研發(fā)及應用,以智能語(yǔ)音為切入點(diǎn)積極布局整個(gè)人工智能領(lǐng)域。語(yǔ)音交互作為人機交互的重要演進(jìn)方向,從感知智能到認知智能,基于深度神經(jīng)網(wǎng)絡(luò )等方法,以語(yǔ)音語(yǔ)言為切入的認知計算將是人工智能發(fā)展的必然路徑。因此,語(yǔ)音交互技術(shù)在服務(wù)機器人博弈中扮演著(zhù)十分重要的角色。
毫不遜色的中國造智能語(yǔ)音
外科技巨頭在語(yǔ)音上一如既往的強勢,可以說(shuō),語(yǔ)音已經(jīng)成為必爭之地。而語(yǔ)音識別領(lǐng)域,中國并不落后于發(fā)達國家,不少技術(shù)處于國際領(lǐng)先地位。
評論