基于DSP芯片的MELP聲碼器的算法實(shí)現
關(guān)鍵詞:MELP;語(yǔ)音編碼;定點(diǎn)DSP芯片TMS320VC5416
1 引言
1996年3月,美國政府數字語(yǔ)音處理協(xié)會(huì )(DDVPC)選擇了2.4kbps混合激勵線(xiàn)性預測(MELP)語(yǔ)音編碼器作為窄帶保密語(yǔ)音編碼的產(chǎn)品以及各種應用的新標準由于MELP具有良好的音質(zhì)、極低的碼率,以及良好的抗誤碼特性,可以應用在IP PHONE、移動(dòng)通信、衛星通信等領(lǐng)域,尤其在需要大量存儲話(huà)音的場(chǎng)合和保密通信等方面,具有很好的發(fā)展前景。
編碼算法有硬件實(shí)現和軟件實(shí)現兩種方式,軟件實(shí)現靈活性強,但處理速度較慢,一般不能滿(mǎn)足實(shí)時(shí)處理的要求。硬件實(shí)現分為專(zhuān)用法和通用法兩種。通用法是基于通用數字信號處理器芯片實(shí)現編碼算法的,它具有體積小、功耗低、運算速度快等優(yōu)點(diǎn),其靈活性主要表現在軟件易于更改以及對各種算法的處理和復雜算法的實(shí)現上,非常適用于語(yǔ)音信號、視頻信號等壓縮處理。
MELP算法復雜度較高,因此實(shí)時(shí)實(shí)現必須借助于高性能的數字信號處理芯片。目前國內還沒(méi)有用于研究聲碼器算法的專(zhuān)用芯片。因此,從功耗和性能多方面考慮,本文采用通用法實(shí)現MELP聲碼器算法,選擇TI公司的TMS320VC5416 DSP芯片作為主處理器,完成聲碼器的主要功能。
2 MELP編解碼算法
2.1 編碼部分
編碼器基于線(xiàn)性預測分析合成技術(shù),采樣率為8kHz,以180采樣值(22.5ms)為一幀進(jìn)行編碼,總體框圖見(jiàn)圖1。
輸入的原始語(yǔ)音信號經(jīng)過(guò)隔直濾波(即高通濾波),得到目標信號S(n)。再對目標信號作以下處理:①低通濾波后用歸一化互相關(guān)法進(jìn)行基音粗估,然后根據[0Hz,500Hz]子帶信號圍繞粗估基音估算分數基音;②帶通分析,在5個(gè)子帶計算話(huà)音強度,以決定各子帶的清/濁音判決,其中[0Hz,500Hz]子帶強度用于確定非周期標志位;③計算LPC和尖峰值,用L-D算法提取10個(gè)LP系數,然后乘以帶寬擴展系數,使用得到的系數計算殘差信號,對殘差信號的160個(gè)抽樣計算尖峰值;④使用截止頻率為1kHz的6階巴特沃茲濾波器低通濾波殘差信號,結合上一子幀的基音和當前子幀的分數基因,搜索出最終基音周期;⑤使用一個(gè)基音自適應窗采用一幀兩次的方法對增益進(jìn)行量化;⑥LPC分析,并轉換成線(xiàn)譜對LSP參數量化;⑦將量化后的LSP參數轉換為L(cháng)PC參數并進(jìn)行逆濾波操作,殘差信號補0至512點(diǎn),對其進(jìn)行512點(diǎn)FFT,利用頻譜峰點(diǎn)檢測算法找到前10次諧波對應的傅立葉系數輸出。
圖1 MELP編碼器編碼原理圖
2.2 解碼部分
解碼器從信道接收到的數據中恢復出每幀的所有參數,經(jīng)判斷如果此幀是比較安靜的語(yǔ)音幀,則增加對接觸的兩個(gè)子幀增益進(jìn)行噪聲衰減處理,同時(shí)改變噪聲估計的值。所有合成的參數對其做基音同步內插處理,這些內插的參數包括基音周期、增益、LSF系數、顫動(dòng)強度、量化的傅立葉幅度、用于產(chǎn)生混合激勵信號的周期信號濾波器的系數和噪聲濾波器系數、自適應增強濾波器的譜斜度系數。內插完成后,使用被子帶濾波器濾波后的周期信號和噪聲激勵信號相加來(lái)產(chǎn)生混合激勵信號。然后兩個(gè)激勵信號被分別濾波,并相加得到激勵信號。合成混合激勵信號后,信號經(jīng)自適應譜增強濾波器處理,以改善共振峰的形狀。隨后,激勵信號進(jìn)行LPC合成得到合成語(yǔ)音。LPC合成用了一個(gè)直接形式的濾波器,其系數由插值后的LSP參數得到,合成的語(yǔ)音信號經(jīng)增益調整和脈沖散布濾波后輸出??傮w框圖見(jiàn)圖2。
圖2 MELP編碼器解碼原理圖
3 TMS320VC5416簡(jiǎn)介
TMS320VC5416的總體系結構圖如圖4所示。其內部的高性能CPU擁有算術(shù)邏輯單元ALU、2個(gè)40位累加器ACCA和ACCB、40位桶行移位寄存器、乘累加單元以及尋址單元,算術(shù)邏輯單元包括1個(gè)40位的ALU,1個(gè)比較、選擇和存儲單元(CSSU)和1個(gè)指數編碼器,具有高度的并行性。本文采用的TMS320VC5416芯片最大可尋址能力為192K字(包括64K字的程序空間、64K字的數據空間和64K字的I/O空間),擴展尋址模式下有256K字~8M字的擴展地址空間,并擁有一套高效靈活的指令集。其指令周期為6.25ns,執行速度最高可以達到160MIPS,完全可以滿(mǎn)足實(shí)時(shí)處理的要求。
圖4 TMS320VC5416總體系結構圖
4 軟件設計及其關(guān)鍵問(wèn)題
軟件設計包括編碼流程和解碼流程,編碼流程圖如圖3所示。由于解碼過(guò)程相對簡(jiǎn)單,故此處只給出編碼流程圖。
此軟件流程設計完全按照MELP原理,在實(shí)際編程過(guò)程中需要注意以下幾個(gè)關(guān)鍵問(wèn)題。
圖3 MELP編碼流程圖
⑴存儲器分配問(wèn)題
由于TMS320VC5416采用雙總線(xiàn)結構,提供了許多多功能指令,在實(shí)際實(shí)現時(shí)要充分考慮到這些特點(diǎn),盡量用多功能指令,并且合理分配使用各個(gè)寄存器和指針。例如:MAC指令可以在一個(gè)指令周期內完成乘加操作,還可以結合寄存器的合理安排實(shí)現連續乘加,而不需要緩存中間數據,從而大大提高了運算效率。另外,要充分利用TMS320VC5416提供的專(zhuān)用的硬件結構、尋址方式及特殊指令。如:環(huán)形存儲器尋址方式、雙操作數尋址方式、EXP指令和NORM指令、舍入操作等,恰當使用這些方式和指令可以大大提高軟件效率。
⑵ 數的定標
TMS320VC5416采用定點(diǎn)數進(jìn)行數值運算,其操作數一般采用整型數表示。但它的指令支持小數模式和整數模式兩種運算模式。對DSP而言,參與數值運算的數就是16位的整型數。在多數情況下,數學(xué)運算過(guò)程中的數不一定都是整數,這就需要程序員來(lái)確定小數點(diǎn)的位置,即數的定標。TMS320VC5416中數的定標有兩種表示法:Q表示法和S表示法。在此軟件中用Q表示法表示。
在程序中需要經(jīng)常判斷運算結果是否溢出。TMS320VC5416芯片本身設有溢出保護功能,溢出的處理是通過(guò)設置芯片中PMST寄存器的OVM位自動(dòng)執行的??梢栽诔绦虻拈_(kāi)始就設置溢出功能有效,一旦出現溢出異常,則累加器ACC的結果置為最大的飽和值(上溢位7FFFH,下溢位8001H),從而達到防止溢出引起精度嚴重惡化的目的。
⑶防止流水線(xiàn)沖突
流水線(xiàn)是TMS320VC5416最具特色的部分,它大大的提高了TMS320VC5416的性能,但當DSP資源同時(shí)被不在同一流水線(xiàn)階段的指令使用,或在存取某些寄存器時(shí)容易引起流水線(xiàn)沖突。編譯時(shí)會(huì )編譯器將自動(dòng)插入一個(gè)或幾個(gè)空操作,從而增加了所需的計算量,降低了軟件效率,因此軟件設計開(kāi)發(fā)中需要避免流水線(xiàn)沖突。
5 測試結果
目前該編解碼器已通過(guò)MELP的全部測試矢量驗證。系統實(shí)時(shí)實(shí)現編解碼時(shí),經(jīng)過(guò)非正式的主觀(guān)測試結果表明,MELP算法的MOS分在3.3左右,其清晰度、自然度和抗噪聲性能明顯優(yōu)于傳統LPC算法。表1和2分別給出了在定點(diǎn)DSP芯片TMS320VC5416上實(shí)時(shí)實(shí)現MELP算法的編解碼器所需的存儲量和計算量。
從表1可見(jiàn),程序和數據存儲區總存儲量共25.2K字,由于TMS320VC5416內部RAM的大小為128K字,因此,程序boot時(shí),可以一次將所有程序和數據直接搬移到芯片內部RAM里運行。表2顯示了對該聲碼器所用資源的統計結果。在全雙工時(shí),最大運算量為39.9MIPS,完成滿(mǎn)足實(shí)時(shí)實(shí)現的要求。
以上分析結果顯示,單片TMS320VC5416芯片最多可實(shí)現4路語(yǔ)音編解碼,片上剩余的資源還可以實(shí)現其它附加功能。
表1 編解碼器占用存儲器資源
表2 編解碼器運算量分析
7 總結
創(chuàng )新點(diǎn):本文介紹了混合激勵線(xiàn)性預測(MELP)聲碼器算法,簡(jiǎn)要分析了該算法的編解碼原理。同時(shí),本文選用TI公司的TMS320VC5416 DSP芯片進(jìn)行了實(shí)時(shí)實(shí)現,指出了在軟件實(shí)現中需要注意的關(guān)鍵問(wèn)題。經(jīng)非正式主觀(guān)測試結果表明,該算法自然度、清晰度和抗噪聲性能明顯優(yōu)于傳統LPC算法,適用于短波窄帶數字保密通信、無(wú)線(xiàn)通信等需要低速率的語(yǔ)音編碼場(chǎng)合,具有廣闊的應用前景。
參考文獻:
[1] SUPPLEE L M,McCree A V. MELP:the new federal standard at 2400bit/s[A]. In:Proc ICASSP'97 [C]. Munich, Germany :1997,1 591-1 594.
[2] McCree A V,De MARTIN JC. A .1.6kb/s MELP coder for wireless communications [J].IEEE Speech Coding Workshop. Pennsyvalia, 1997(9):23-24.
[3]陳亮,張雄偉,陸惠娣.一種改善激勵源的1.2kb/s語(yǔ)音編碼算法及其實(shí)時(shí)實(shí)現.解放軍理工大學(xué)學(xué)報,2002,8
[4]楊行峻,遲惠生,語(yǔ)音信號數字處理[M].電子工業(yè)出版社,1998.251-256.
[5]張雄偉.DSP芯片的原理與開(kāi)發(fā)應用[M].電子工業(yè)出版社,1997.
[6]房德新,魏建強,ITU G.726語(yǔ)音編碼器在DSP上的實(shí)現.微計算機信息[J]2001.10
評論