聚焦2016:關(guān)于語(yǔ)音識別、圖像識別及大數據
深度學(xué)習
本文引用地址:http://dyxdggzs.com/article/201602/286964.htm沒(méi)有基礎的技術(shù)實(shí)力,語(yǔ)音和圖像是好玩不起來(lái)的,而高級和低級的門(mén)檻就在深度學(xué)習的研究上。國內雖然起步較晚,好歹在去年趕上了這波風(fēng)潮,包括圖像識別和語(yǔ)音識別在內,還有自動(dòng)駕駛、無(wú)人機、環(huán)境還原、機器人等項目,前段時(shí)間很火的谷歌AlphaGo在圍棋領(lǐng)域擊敗了歐洲二段冠軍,也是歸功于深度學(xué)習的算法支持??梢哉f(shuō)跟用戶(hù)有交互行為的產(chǎn)品,都開(kāi)始進(jìn)行深度學(xué)習AI的研究了。通過(guò)神經(jīng)網(wǎng)絡(luò )的訓練學(xué)習,語(yǔ)音識別變得更聰明, 實(shí)現快速精準的識別動(dòng)作以外,還能對下一句的語(yǔ)境情緒進(jìn)行預測,模擬真人對話(huà)。另外,語(yǔ)音識別大量運用在翻譯市場(chǎng),爭取未來(lái)十年內在專(zhuān)業(yè)翻譯領(lǐng)域完全替代人類(lèi)。圖像識別過(guò)去大多是建庫識別,深度學(xué)習釋放了圖像識別的識別領(lǐng)域,把識別對象的年齡變化記憶下來(lái),實(shí)現動(dòng)態(tài)、多角度、不同光照變化下的識別。

應用領(lǐng)域
安防市場(chǎng)是要求語(yǔ)音和圖像識別技術(shù)雙高的行業(yè)之一,未來(lái)將不局限在解鎖開(kāi)門(mén)等基礎功能,運用圖像識別技術(shù),實(shí)現對象動(dòng)作識別,根據威脅等級進(jìn)行危險性判斷,提前發(fā)出警報或報警。語(yǔ)音識別的運用領(lǐng)域將超高端化發(fā)展,近年來(lái)語(yǔ)音識別速度屢創(chuàng )新高,在翻譯市場(chǎng)、智能硬件助手、AI輔助,行車(chē)幫助等等方面實(shí)現價(jià)值。而娛樂(lè )領(lǐng)域的玩法變得多元化,像最近大熱的faceu,運用了臉部識別跟蹤技術(shù),讓普通的自拍可以DIY。還有video++視頻開(kāi)放平臺,可以對視頻中的明星、衣服同款進(jìn)行識別搜索,打開(kāi)了視頻到電商的入口。乘著(zhù)去年SaaS的風(fēng)口,國內外陸續出現了語(yǔ)音識別、圖像識別的技術(shù)開(kāi)放平臺,從專(zhuān)業(yè)到普通領(lǐng)域,語(yǔ)音識別和圖像識別將在2016年做到技術(shù)全覆蓋。

大數據
數據收集是一個(gè)從被動(dòng)到主動(dòng)的過(guò)程,語(yǔ)音識別從接受指令變成了對指令使用頻率的分析,進(jìn)而形成用戶(hù)的習慣圖表。圖像識別亦然,針對用戶(hù)的識別頻率,分析出用戶(hù)的興趣畫(huà)像,這將給予廣告主帶來(lái)精準廣告推送的商機?! ?/p>
評論