VoIP聲學(xué)回聲消除算法研究
近年來(lái),VoIP(Voice over IP)技術(shù)及其業(yè)務(wù)的迅速發(fā)展,對傳統的電信業(yè)務(wù)造成了巨大的沖擊,與傳統電話(huà)相比,IP電話(huà)以其網(wǎng)絡(luò )帶寬利用率高,通話(huà)成本低,可靈活地提供豐富的增值功能而備受市場(chǎng)青睞。然而,由于VoIP的語(yǔ)音在與其他數據一起在網(wǎng)絡(luò )中傳輸時(shí)要經(jīng)過(guò)壓縮、編碼、打包等一系列處理,造成回聲路徑的延遲較大,延遲抖動(dòng)也較大,嚴重影響了話(huà)音質(zhì)量,阻礙了VoIP市場(chǎng)的拓展。因此,在VoIP終端上增加回聲消除算法已成為必然。
1 聲學(xué)回聲消除技術(shù)的原理
1.1 聲學(xué)回聲產(chǎn)生原理
根據回聲的產(chǎn)生原因,回聲可以分為聲學(xué)回聲和電學(xué)回聲兩類(lèi)。電學(xué)回聲是由于電路阻抗不匹配造成的,通常影響比較小。隨著(zhù)消除回聲技術(shù)的發(fā)展,當前回聲消除研究的重點(diǎn)已由“電學(xué)回聲”的消除轉向了“聲學(xué)回聲”的消除。聲學(xué)回聲指設備的一部分聲音信號回饋到同一設備的受話(huà)器,分為直接回聲和間接回聲。直接回聲指揚聲器的聲音未經(jīng)任何反射直接進(jìn)入麥克風(fēng),這種回聲延遲最短。間接回聲是指揚聲器播放的聲音經(jīng)不同的路徑一次或多次反射后進(jìn)入麥克風(fēng)所產(chǎn)生的回聲集合,其主要特點(diǎn)是回聲路徑?jīng)_激響應變化范圍大,變化快,沖激響應持續時(shí)間長(cháng),一般在50~300 ms。這使得自適應建模濾波器的階數很高,因而成為語(yǔ)音通信系統回聲的主要難題。
1.2 聲學(xué)回聲消除的原理
自適應回聲抵消的基本思想是估計回聲路徑的特征參數,產(chǎn)生一個(gè)模擬的回音路徑,得出模擬回聲信號,從接收信號中減去該信號,實(shí)現回聲抵消。圖1給出了單向傳輸的聲學(xué)消回聲器AEC的原理圖。
圖1中,y(n)代表來(lái)自遠端的信號;r(n)是經(jīng)過(guò)回聲通道而產(chǎn)生的不期望的回聲;x(n)是近端的語(yǔ)音信號;D口的近端信號疊加有不期望的回聲。對消回聲器來(lái)說(shuō),接收到的遠端信號作為參考信號,消回聲器根據由自適應濾波器產(chǎn)生回聲估計值,將r1(n)從近端帶有回聲的語(yǔ)音信號減去,就得到近端傳送出去的信號μ(n)=x(n)+r(n)-r1(n)。在理想情況下,經(jīng)過(guò)消回聲處理后,殘留的回聲誤差e(n)=r(n)-r1(n)將為0,從而實(shí)現回音消除。
2 自適應回聲消除算法理論
回聲消除理論的難點(diǎn)是估計回聲與近端輸入信號之間的同步問(wèn)題以及如何對雙端講話(huà)進(jìn)行處理的問(wèn)題,若這兩個(gè)問(wèn)題處理不好,就會(huì )造成濾波器的發(fā)散,不但不能消除回聲,反而會(huì )引入更煩人的噪聲。
2.1 雙端話(huà)音處理與MDF算法結合
在NLMS算法中,假設輸入近端背景噪聲與遠端信號均為白噪聲,那么兩信號間為時(shí)間無(wú)關(guān)的,因此可以求得最優(yōu)步長(cháng)因子:
式中:r(n)為殘留回聲的方差的估計值;e(n)為誤差信號的方差的估計值。
但是用LMS/NLMS算法來(lái)進(jìn)行語(yǔ)音信號的聲學(xué)回聲消除時(shí),兩信號時(shí)間無(wú)關(guān)的假設就不完全成立,因此只能借助于頻域處理法。MDF算法相當于對每一個(gè)頻率使用NLMS算法。為了解決雙端講話(huà)檢測這個(gè)難題,文獻[6]提出了一種與MDF相結合的不需要顯式進(jìn)行雙端話(huà)音檢測的方法,以下是推導。由于信號在頻域的相關(guān)程度比在時(shí)域的相關(guān)程度小得多,而且步長(cháng)因子μ也可以變換到頻率域μ(k,l),即有公式:
式中:k為輸入信號塊索引號;l為信號頻率。假定殘留回聲是泄漏因子η(l)與回聲估計值的乘積,即:
又因為步長(cháng)因子需要在雙端講話(huà)發(fā)生時(shí)迅速對其做出反應,故可以有等式:
評論