朗谷數字音頻處理技術(shù)在音頻及網(wǎng)絡(luò )通訊領(lǐng)域的應用
2008年12月15日出版的《第一財經(jīng)周刊》刊登了科爾尼資訊管理公司發(fā)布的2008年全球化城市指數的前60個(gè)城市,上海、北京、深圳入選其中,而07年有本暢銷(xiāo)書(shū)《世界是平的》,則把網(wǎng)絡(luò )通訊技術(shù)的變革視為使全球化的力量之一,統一通訊技術(shù)發(fā)展方向是IP將融合所有協(xié)議,AV將融合所有格式,互聯(lián)互通,開(kāi)放式代替封閉式,技術(shù)越復雜就越要求用戶(hù)應用上的簡(jiǎn)單,而數字音頻處理技術(shù)則是網(wǎng)絡(luò )通訊中最基礎和最核心的技術(shù)之一,朗谷數字實(shí)驗室專(zhuān)注于此項技術(shù)的研發(fā)。
一、 與朗谷數字音頻處理技術(shù)關(guān)聯(lián)的基礎概念
歷史
回音消除已經(jīng)替代了早期的回音抑制,回音抑制最早始于20世紀50年代,在衛星通訊環(huán)境中用來(lái)控制由于比較長(cháng)的信號延時(shí)而聽(tīng)到的回音。最早的回音消除理論在二十世紀六十年代在A(yíng)TT貝爾實(shí)驗室中發(fā)展起來(lái),但是直到20世紀70年代末,由于受到電子行業(yè)的技術(shù)能力限制,商用回音消除產(chǎn)品一直沒(méi)有取得太大的發(fā)展。
隨著(zhù)DSP的飛速發(fā)展使得回音消除產(chǎn)品變得更小和更具有效費比。在20世紀九十年代,回音消除器不再作為一個(gè)獨立的設備,第一次被集成于語(yǔ)音網(wǎng)關(guān)中(加拿大北電公司DMS-250)。這個(gè)整合使得回音消除直接內置于語(yǔ)音網(wǎng)關(guān)中,意味著(zhù)回音消除器可以在通話(huà)過(guò)程中非??煽康乇婚_(kāi)啟或者關(guān)閉,在語(yǔ)音通訊和數據通信中區分不同的干線(xiàn)組取得所需要的信號。
1、回聲與延時(shí)的關(guān)系
回聲和延時(shí)是兩個(gè)不同的概念,延時(shí)不會(huì )加重或者改變回聲的量值。聲音有一個(gè)遮掩效應,例如我們在山谷里那么清楚的聽(tīng)到回聲的原因是因為聲音的傳遞時(shí)間長(cháng),聲音反射回來(lái)的時(shí)間就長(cháng),超過(guò)1秒甚至2秒,聲音的傳遞時(shí)間長(cháng)了,聲音的遮掩效應會(huì )失去,這樣人的耳朵就會(huì )感覺(jué)到聽(tīng)到這個(gè)回聲,回聲是一直存在的,專(zhuān)門(mén)的研究機構做過(guò)專(zhuān)門(mén)的測試,聲音的傳遞小于20毫秒左右的時(shí)候,遮掩效果發(fā)揮作用,人耳一般聽(tīng)不出來(lái),超過(guò)20毫秒以后遮掩效應開(kāi)始衰減,超過(guò)50毫秒,聲音的遮掩效應就基本消失了,只要有微弱的回聲人耳就能聽(tīng)得到。
2、回聲和數字延時(shí)及語(yǔ)音壓縮技術(shù)的關(guān)系
數字延時(shí)技術(shù)就是把線(xiàn)性的信號,語(yǔ)音信號從喇叭或者電話(huà)中傳出去前,經(jīng)過(guò)數字信號采樣處理會(huì )延遲一段時(shí)間,就使得回音回來(lái)延遲的更長(cháng),所以我們能夠聽(tīng)到。而語(yǔ)言壓縮技術(shù)是對一段數字信號進(jìn)行采樣后壓縮,然后再把這個(gè)壓縮信號送出去,這一段數字信號一般是30毫秒,40毫秒左右,語(yǔ)音數據經(jīng)過(guò)拿出來(lái)做處理,處理之后,再送出去,這樣就增加了40毫秒的延時(shí),導致的結果就是有回音回來(lái)被聽(tīng)到。例如我們現在的電話(huà)網(wǎng)絡(luò )都采用用數字交換機,而以前都是模擬交換機,送出的都是模擬信號,這個(gè)信號是以光速傳遞的,所以在模擬交換機時(shí)代,打本地電話(huà)和長(cháng)途電話(huà)感覺(jué)不到有回音,只有通過(guò)衛星打國際電話(huà)的時(shí)候聽(tīng)到有回音,因為延遲時(shí)間就變長(cháng)了,那么打本地電話(huà),電信號以光的速度傳遞,只有幾個(gè)毫秒,我們就聽(tīng)不見(jiàn)感覺(jué)不到回音的存在,而現在的電話(huà)網(wǎng)絡(luò )全都用數字式的,它把電信號變成數字信號,而數字信號的處理,不是采一個(gè)數字就送出去,它是采集一段信號,可能是20毫秒40毫秒的信號進(jìn)來(lái)了,把它處理一下,然后送出去,這樣的數字處理的效率很高,把信號先壓縮以后,再送出去,結果就是效率更高,本來(lái)一根線(xiàn)只能送一路電話(huà),現在可能送10個(gè)電話(huà),但是提高效率的同時(shí),增加了延時(shí)作為結果,這是就導致回音的出現,例如我們打手機有回音,也是這種原因。
二、AEC(Adaptive Echo Control) 朗谷自適應回聲消除回音器的原理
1、回聲消除原理
回音的產(chǎn)生既復雜也簡(jiǎn)單,一般喇叭信號出來(lái)聲音它會(huì )傳遞到麥克風(fēng),這個(gè)傳遞過(guò)程本身從技術(shù)上講就有一個(gè)傳遞函數,傳遞本身就已經(jīng)發(fā)生了一些變化,在傳遞過(guò)程中,高頻和低頻的傳遞系數是不一樣的,通常低頻傳遞的效率更高,高頻傳遞的效率低一點(diǎn) 。麥克風(fēng)跟喇叭的位置靠的越近,聲音傳遞的時(shí)間越短,稍微離的遠一點(diǎn),那么延遲的時(shí)間會(huì )多一點(diǎn),即使聲音直接傳過(guò)去,信號就已經(jīng)有時(shí)間延時(shí)了,麥克風(fēng)位置的改變,回音也隨之改變,傳遞的聲音隨著(zhù)距離位置的改變,它傳遞的時(shí)間也發(fā)生改變,接觸到信號也就改變了,但聲音除了這個(gè)直接信號以外,聲音在空間中它是往各個(gè)方向傳遞的,它會(huì )碰到墻壁、碰到天花板反射回來(lái),然后反射到麥克風(fēng),有的反射到桌面然后到麥克風(fēng),各個(gè)情況都存在,所以這是一個(gè)很復雜的問(wèn)題,所有的信號最終的結果是疊加在一起的,疊加的結果就是有的信號被增強了,有的信號被減弱了,各種各樣的都有,然后墻壁對聲音信號的反射也不一樣,高頻低頻都不一樣,所以結果是一個(gè)復雜的所有疊加的結果,有的早有的晚,有的強有的弱,朗谷做回音消除呢,就是把總的傳遞函數效果算出來(lái),那么并不是簡(jiǎn)單的說(shuō)兩個(gè)信號一樣,這個(gè)你算出來(lái)的回音信號,跟送出去的參考信號,送到喇叭去的信號并不一樣,它已經(jīng)經(jīng)過(guò)了一些傳遞改變了,那么可能有些已經(jīng)延遲了100個(gè)毫秒,這是總的結果,回音消除的原理就是信號出去,然后麥克風(fēng)收的信號肯定是這些信號各種各樣的直接間接的傳遞,反射回來(lái)的信號疊加到一起,我們把這些傳遞函數計算出來(lái),疊加結果計算出來(lái),這樣就能得到一個(gè)回音信號和麥克風(fēng)信號,在理想條件下如果計算出來(lái)的和麥克風(fēng)信號一樣,就可以把回聲消除掉,如果計算出來(lái)的有誤差,那么就不可能消除干凈,這就是回聲消除的原理?;芈曄夹g(shù)后面還有很復雜的數學(xué)問(wèn)題?;匾粝铍y的地方是變量太多,回音模型的改變回音的疊加的結果都要計算出來(lái)。另外還有采用回聲抑制進(jìn)行回聲處理的方法,即非線(xiàn)性的過(guò)度就是兩邊同時(shí)說(shuō)話(huà)的時(shí)候,它分辯不出那個(gè)是回音信號,所以就cutoff,剪切掉拉,這是處理不當,也可以說(shuō)是單工,就是因為線(xiàn)性的做的不夠好,還有回音,所以它就多切掉一點(diǎn),回聲抑制就是這個(gè)道理。也就是回聲消除和回音抑制的不同。
2、回聲消除技術(shù)關(guān)鍵性技術(shù)指標
1)ITU-T的G.167
這是國際電信聯(lián)盟有一個(gè)標準,這個(gè)標準要求任何回聲消除必須要做到降低45分貝以上,但是達到這個(gè)標準不是最好的,因為人還能聽(tīng)到這個(gè)回聲,這個(gè)是最基本的標準。原則上麥克風(fēng)信號收的信號有一個(gè)電平,這個(gè)電平我們可以用分貝來(lái)標示,如果這個(gè)信號的電平比如說(shuō)是-3dB,如果你消除了30dB,那么結果就變成了-30Db,因為10分貝能量上是10倍,20個(gè)分貝就是100倍,人耳能聽(tīng)到的聲音范圍值大約是100萬(wàn)倍,所以人耳朵能聽(tīng)到能量范圍值是60分貝左右,回聲處理要消除60分貝以上人耳才聽(tīng)不出來(lái),如果只消除30或者40分貝,能量降低到千分之一,萬(wàn)分之一,雖然能量弱了很多,但還是能聽(tīng)到。
朗谷的回聲消除技術(shù)通過(guò)線(xiàn)性和非線(xiàn)性的方法可以做到60個(gè)分貝甚至更高,可以達到非常優(yōu)秀的回聲消除的效果,人耳無(wú)法感受到回聲的存在。
2)回聲消除的帶寬:
窄帶模式頻率: 300Hz—3.4kHz
寬帶頻率模式: 50Hz—7kHz 應用廠(chǎng)家ploycom/Cisco/skype
超寬帶模式:50Hz—14kHz,一般稱(chēng)HD高清音頻模式
全音域模式:20Hz—20kHz
朗谷的回聲消除技術(shù)采用20Hz—20kHz的全音域模式
評論