IBM 語(yǔ)音識別新方向:仿生蝙蝠耳能用聲納精準“聆聽(tīng)”
蝙蝠使用生物聲吶,為夜晚在叢林中飛行導航。他們的超聲波脈沖,可以比人造聲吶裝置更精確地對聲音進(jìn)行定位。為復制、駕馭這種能力,IBM 學(xué)院獎獲得者 Rolf Müller 教授協(xié)同他在弗吉尼亞理工學(xué)院(Virginia Tech)的團隊,設計了一種人造蝙蝠耳。
本文引用地址:http://dyxdggzs.com/article/201612/342194.htm

Rolf Müller 的研究引起了 IBM 的注意。IBM 專(zhuān)家韓金萍(音譯)的神經(jīng)計算團隊,和 IBM Watson 語(yǔ)音專(zhuān)家崔曉東(音譯)和他的同事, 看到了 Müller 教授人造“動(dòng)態(tài)外耳”(dynamic peripheral,蝙蝠可轉動(dòng)的外耳使它們的生物聲吶更加準確)的潛力 ,并希望借此提高人類(lèi)語(yǔ)音理解的能力。他們把 Müller 的博士生 Anupam Gupta 納入團隊,一同他們探索人造蝙蝠仿生耳在語(yǔ)音處理的應用。
他們發(fā)現,這些仿生耳不僅是很有效的聲吶裝置,對語(yǔ)音識別同樣能起到作用。

模仿菊頭蝠的人造耳
研究團隊根據蝙蝠改變耳朵形狀的能力,仿制了一個(gè)動(dòng)態(tài)接收系統。它能提高自動(dòng)語(yǔ)音識別系統(ASR)的精確度,還能更準確地對談話(huà)者定位。韓金萍將在他們的論文《受菊頭蝠啟發(fā)的接收動(dòng)力學(xué)把動(dòng)態(tài)特點(diǎn)加入語(yǔ)音信號》,及本周美國聲學(xué)協(xié)會(huì )第 172 屆會(huì )議上展示了這一發(fā)現。
這些動(dòng)態(tài)系統有潛力發(fā)展成讓使用者“像蝙蝠那樣聆聽(tīng)”的語(yǔ)音接收設備。這會(huì )改進(jìn)現有的助聽(tīng)器和指向性傳聲器。并可應用于任何需要對聲音來(lái)源進(jìn)行定位、理解的場(chǎng)景。
設想你身處一個(gè)忙碌、吵鬧的集市。聽(tīng)清楚你旁邊的人在說(shuō)什么都可能是一項挑戰。有了這項技術(shù),同伴的聲音就能被一個(gè)可變形的助聽(tīng)器識別,然后翻譯成你能聽(tīng)懂的話(huà)。它還可以過(guò)濾掉鬧市的雜音,和其他人嗡嗡的說(shuō)話(huà)聲。
仿生蝙蝠耳的生物聲吶算法
蝙蝠的超聲波具有 10 – 200 kHz 的頻率,而人耳只能識別 20 Hz – 20 kHz 的聲音。因此對我們來(lái)說(shuō)它聲調太高,大多數是聽(tīng)不到的。為了駕馭蝙蝠的生物聲吶頻率和精度,Gupta 加入韓金萍團隊編寫(xiě)能夠把語(yǔ)音訊號轉化為超聲波脈沖的代碼——然后再把超聲波轉化為我們能夠聽(tīng)到的正常語(yǔ)言。
這首先需要建立一個(gè)數據庫。為了盡可能地簡(jiǎn)化,韓金萍團隊使用了卡內基梅隆大學(xué)開(kāi)源數據庫中,11 個(gè)美式英語(yǔ)朗讀者的英語(yǔ)字母和數字的發(fā)音。
舉例子,以字母“A” 或者數字“1”形式出現的數據,被麥克風(fēng)接收,然后轉化為超聲波信號。超聲波揚聲器播放該信號。隨后,具有“動(dòng)態(tài)外耳”的人造蝙蝠耳接收信號。最后,軟件把超聲波信號轉化為原始數據——字母“A” 或者數字“1”。
現實(shí)(鬧市)中的人造耳朵
雖然只包含字母和數字的聲音信號數據庫有較大限制,但通過(guò)分析它,韓金萍團隊表示人造耳用“動(dòng)態(tài)、方向性的的時(shí)間頻率模型”豐富了語(yǔ)音信號。下一步,研究人員把人造耳處理后的聲音與原始語(yǔ)音進(jìn)行對比,來(lái)衡量人造耳的精度。因此,他們把原始語(yǔ)音數據和經(jīng)人造耳處理的聲音數據,放入分類(lèi)器( classifier )中進(jìn)行識別。67% 的語(yǔ)音信號能被成功識別出來(lái)。而在沒(méi)有動(dòng)態(tài)外耳的對照組中,只有 35% 的聲音數據被識別。
有了更多的可用分析數據后,研究員們將著(zhù)手用行業(yè)基準來(lái)對該系統進(jìn)行測試,并開(kāi)發(fā)仿生學(xué)習算法。再或者,將來(lái)他們可能會(huì )開(kāi)發(fā)一個(gè)“聆聽(tīng)” app,把智能手機麥克風(fēng)變成接入物聯(lián)網(wǎng)的指向性麥克風(fēng),來(lái)幫助使用者選擇現實(shí)中他想要聽(tīng)到的聲音。IBM 研究人員認為,實(shí)現它并不是太遙遠。
評論