Alexa 笑了,聲紋識別該醒醒了!
人工智能已經(jīng)火了一陣子了。
本文引用地址:http://dyxdggzs.com/article/201804/378011.htm但是,我們確實(shí)還有點(diǎn)云里霧里,盡管所有的企業(yè)都號稱(chēng)用AI改變一切,但是現階段,我們不得不承認,以智能音箱為代表的人工智能確實(shí)不是人們所期待的。
此外,不得不吐槽的智能語(yǔ)音客服,大家隨便給淘寶或者京東打個(gè)電話(huà)體驗下就知道了。他們并不能有效地識別出你語(yǔ)意(當然至少是我說(shuō)的不能識別),反而在打電話(huà)中插入了語(yǔ)音客服,體驗稍差,但是可以理解,任何一項技術(shù)由創(chuàng )新走向成熟,必定有有體驗差的階段,我們現在就是這個(gè)階段。
而且,最近Alexa突然大笑的事件,人工智能悲觀(guān)論又被廣泛討論起來(lái),透過(guò)這場(chǎng)事件,我們可以詳細了解下跟聲音有關(guān)的人工智能。
1.為什么是智能音箱?
不知道大家有沒(méi)有注意到,好像互聯(lián)網(wǎng)巨頭公司,都有自己的智能音箱產(chǎn)品。
根據奧維云網(wǎng)研究報告指出,2017年全球智能音箱市場(chǎng)規模達到3000萬(wàn)臺,包括谷歌、亞馬遜以及蘋(píng)果等科技巨頭。從國內看,2017年市場(chǎng)銷(xiāo)量176萬(wàn)臺,銷(xiāo)售額4.9億元,市場(chǎng)爆發(fā)背后其實(shí)是企業(yè)激進(jìn)式的推動(dòng),主要體現在產(chǎn)品升級、宣傳推廣、定價(jià)顛覆和節日促銷(xiāo)四個(gè)方面。以天貓精靈舉例,雙十一活動(dòng)價(jià)格僅需99元人民幣。
那么這些巨頭公司,為什么紛紛發(fā)力智能音箱這個(gè)領(lǐng)域呢?
1、智能家庭超級入口
現在家居絕大部分還是通過(guò)接觸才能控制,用手來(lái)打開(kāi)開(kāi)關(guān),或者用遙控器來(lái)關(guān)電視。但是無(wú)論是在電影中還是人們的想象中,人們都期望著(zhù),只需要一句話(huà)就能打開(kāi)家電,通過(guò)語(yǔ)音來(lái)控制各種生活中常見(jiàn)的東西。這些場(chǎng)景中的家居產(chǎn)品,其實(shí)都有一個(gè)共同點(diǎn):全部通過(guò)語(yǔ)音交互來(lái)完成。但現階段,使用遙控器或者是手機甚至是手來(lái)操作,都不能滿(mǎn)足用戶(hù)的需求。所以人們需要一個(gè)接口,能通過(guò)這個(gè)接口來(lái)進(jìn)行控制整個(gè)家里的布局。
在如今盛行人工智能、大數據的時(shí)代,語(yǔ)音交互的實(shí)際使用效果也越來(lái)越實(shí)用。許多廠(chǎng)商在此之前也已經(jīng)推出了智能家居系統,例如蘋(píng)果HomeKit系統,在此基礎上,智能音箱的控制權對于廠(chǎng)商來(lái)說(shuō)就十分重要了。
而智能音箱入口關(guān)鍵不在于音箱的播放功能,而是語(yǔ)音對講功能。未來(lái)真正智能化必定是人與物對講。實(shí)物必須可以聽(tīng)到我們的聲音,必須可以發(fā)出聲音反饋我們。符合條件的只有手機、電視和音箱。但是手機不能解放雙手,并且需要喚醒,電視要保持待機,而且為了控制一個(gè)功能把電視待機太浪費電而且不劃算。只有音箱最合適,隨時(shí)待機,自由對講。
2、大數據采集器
簡(jiǎn)單來(lái)說(shuō),大佬們都希望用智能音箱打開(kāi)物聯(lián)網(wǎng)的接口,以避免自己被淘汰。
憑借著(zhù)銷(xiāo)量不斷進(jìn)行的語(yǔ)音交互,是行業(yè)大佬們進(jìn)行數據采集的路徑之一,目前看來(lái),智能音箱的大玩家,都將輿論引向搶占智能家居的入口,從這個(gè)角度來(lái)看,巨頭們真正的邏輯在于提早布局,完成對數據的收割。對于語(yǔ)音人機交互、物聯(lián)網(wǎng)入口來(lái)說(shuō),數據樣本是未來(lái)核心競爭的關(guān)鍵,要有足夠大的樣本才能為語(yǔ)音交互提供深度學(xué)習的土壤。
舉個(gè)例子來(lái)說(shuō),我們針對一個(gè)固定短語(yǔ)進(jìn)行語(yǔ)音模型的建立,100個(gè)人和1000乃至10000人,所構建的模型是不一樣的,人數越多所構建的模型越精確。
其次,是通過(guò)這樣一個(gè)試驗性產(chǎn)品進(jìn)行數據的采集,從而對智能家居的深度化場(chǎng)景的挖掘,這些制作智能音響的企業(yè), 都擁有自己的云計算業(yè)務(wù)。未來(lái),物聯(lián)網(wǎng)行業(yè)一定是基于大數據和云計算的,而沒(méi)有大量的數據支撐,很多場(chǎng)景以及計算都無(wú)法實(shí)現。
2.為什么是聲紋識別?
這里為什么談到聲紋識別。
這里就涉及到一個(gè)詞義的區別:語(yǔ)音識別和聲紋識別。語(yǔ)音識別更多的偏向其能否識別你說(shuō)的話(huà);而聲紋識別,是指一個(gè)機器能否認出他的主人。
舉個(gè)例子:假設我有一個(gè)天貓精靈它帶有聲紋識別功能(事實(shí)上,天貓精靈已經(jīng)有此項功能),每當我叫他天貓精靈,他能知道,是我在叫他,這個(gè)叫做語(yǔ)音識別。目前市面上可能有上千家公司在做類(lèi)似的工作。但是更難的在這里,如果天貓精靈能識別出是我在叫他,而不是你,也不是其他人,這里就叫做聲紋識別了。所以語(yǔ)音識別,解決了說(shuō)什么的問(wèn)題,而聲紋識別解決了你是誰(shuí)的問(wèn)題。
當前,盡管智能家居語(yǔ)音控制系統已經(jīng)滿(mǎn)足了人們的基本需求,不過(guò),仍然有一些小小的不足,而這方面,就需要聲紋識別技術(shù)進(jìn)行補充了。打個(gè)比方,當聲紋識別技術(shù)發(fā)展較為成熟之時(shí),若一位家庭成員呼喚音箱打開(kāi)自己房間的燈,語(yǔ)音控制系統就能通過(guò)聲紋識別技術(shù)確認說(shuō)話(huà)人的身份,從而準確的打開(kāi)說(shuō)話(huà)人房間的燈。
這樣,當有人非法入侵住宅,若語(yǔ)音控制系統不限制說(shuō)話(huà)人的身份,縱然有著(zhù)智能監控系統,闖入者完全可以直接下命令關(guān)閉監控系統,如此一來(lái),闖入者就成功的得到了住宅的臨時(shí)控制權。當搭載聲紋識別技術(shù),基于聲紋的獨特性,在不能識別出闖入者身份的前提下,語(yǔ)音控制系統就能接著(zhù)進(jìn)行報警等一系列安防措施。
所以,未來(lái)更多的智能家居上面將配有聲紋識別,好處就是你的設備安全性有了一個(gè)新的高度。但是不得不說(shuō),以目前聲紋技術(shù)的發(fā)展,如何在眾多人聲中,識別出你的聲音,或者如何在一個(gè)嘈雜環(huán)境下識別出你的聲音,這些都急需突破。
3.專(zhuān)業(yè)的聲紋識別公司
目前,國內做聲紋的企業(yè),也逐漸起來(lái)。一系列聲紋企業(yè),正在壯大。特別是以科大訊飛為首,整個(gè)行業(yè)都呈現上升發(fā)展的態(tài)勢。
北京君林科技股份有限公司,專(zhuān)業(yè)的電聲企業(yè),打造人工智能時(shí)代的金耳朵。面向全球,提供最領(lǐng)先的音頻領(lǐng)域解決方案和專(zhuān)業(yè)服務(wù),基于聲學(xué)推動(dòng)人工智能技術(shù)產(chǎn)品落地。
公司以打造人工智能領(lǐng)域的音頻硬件平臺及系統平臺,使君林技術(shù)成為人工智能音頻領(lǐng)域不可或缺的環(huán)節為發(fā)展目標。并以此為基礎,全面覆蓋聲學(xué)技術(shù)-固件算法-智能硬件-系統驅動(dòng)-云服務(wù)-大數據-Ai技術(shù)等技術(shù)鏈。
君林科技擁有一整套完整的聲音處理系統解決方案。用戶(hù)可以使用已有或者定制的音頻數據采集方案,通過(guò)君林科技聲紋REST API上傳至云端,由人工智能算法進(jìn)行建模,識別與認證,有效為企業(yè)創(chuàng )造最大價(jià)值。
公司自2016年成立以來(lái),發(fā)展迅速已集結了國內外相關(guān)行業(yè)領(lǐng)先技術(shù)人才,核心團隊成員來(lái)自亞馬遜、摩托羅拉、華為、樂(lè )視等知名企業(yè)。同年,公司在加拿大設有聲學(xué)大數據及人工智能研究中心,與國內知名大學(xué)聯(lián)合建立聲學(xué)實(shí)驗室,打造行業(yè)最前端的音頻技術(shù)。
4.總結
聲紋識別作為人類(lèi)生物特征識別的一個(gè)重要方向,屬于人工智能的重要分支,相信在未來(lái),隨著(zhù)人工智能技術(shù)的發(fā)展,會(huì )有更多的暢想空間,更多的產(chǎn)品服務(wù)于人類(lèi)。
但是,從目前來(lái)看,主要實(shí)際商業(yè)應用場(chǎng)景識別環(huán)境的復雜性可能導致身份識別的誤差較大。因為聲紋識別的核心介質(zhì)是聲音,那么為了聲音的純粹和真實(shí),原則上就需要周?chē)鷽](méi)有雜音。雖然技術(shù)上能做到一定程度的雜音過(guò)濾,但只要是有外界雜音干擾,就必然帶來(lái)誤判的巨大風(fēng)險。但好在,君林科技已經(jīng)有基于聲學(xué)而推動(dòng)產(chǎn)品落地,相信用不了多久,我們就真的可以解放雙手了。
評論