基于TMS320VC5416的自適應變速率聲碼器

作者：時(shí)間：2007-03-09 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

摘要：利用TMS320VC5416實(shí)現的一種高質(zhì)量自適應變速率聲碼器。系統整體結構和工作流程，著(zhù)重介紹了硬件接口方式以及實(shí)現自適應變速率的獨特方法，并介紹了從片外FLASH上電加載大數據量程序的實(shí)現方法，最后統計出了整個(gè)算法對硬件資源的占用情況。關(guān)鍵詞：TMS320VC5416 聲碼器變速率自適應在當前的各種通信系統中，實(shí)時(shí)的語(yǔ)音編解碼通常都在數字信號處理器（ＤＳＰ）上實(shí)現。ＴＩ公司生產(chǎn)的Ｃ５４系列ＤＳＰ具有高性能、低功耗的特點(diǎn)，許多語(yǔ)音編解碼算法都可以在它上面實(shí)現。但傳統的語(yǔ)音編解碼算法都是固定速率的，它們無(wú)法適應不斷變化的網(wǎng)絡(luò )情況和滿(mǎn)足質(zhì)量要求，缺乏靈活性。而且，一般的單速率語(yǔ)音編解碼算法的程序量大都在３０ＫＷｏｒｄ以下，運算量也大都在３０ＭＩＰＳ以下。ＴＩ公司新近推出的ＴＭＳ３２０ＶＣ５４１６芯片擁有１２８ＫＷｏｒｄ的片上ＲＡＭ空間和１６０ＭＩＰＳ的運算能力，只承載單一速率的語(yǔ)音編解碼算法顯然是一種極大的浪費。

清華大學(xué)自主開(kāi)發(fā)的正弦激勵線(xiàn)性預測（ＳＥＬＰ）系列低速率語(yǔ)音編碼算法由于采用了合理的激勵模型，在２．４ｋｂｐｓ、１．２ｋｂｐｓ和０．６ｋｂｐｓ三個(gè)速率上都具有很好的重建語(yǔ)音質(zhì)量。其中，２．４ｋｂｐｓ速率算法的重建語(yǔ)音質(zhì)量與國際上流行的相同速率的高質(zhì)量ＡＭＢＥ算法相當，０．６ｋｂｐｓ算法重建語(yǔ)音的可懂度也能達到９０％以上，十分適合應用在各種軍用語(yǔ)音通信系統中。本文詳細介紹了利用ＴＭＳ３２０ＶＣ５４１６ＤＳＰ實(shí)現的自適應變速率ＳＥＬＰ聲碼器。該聲碼器可根據不同的速率要求自動(dòng)實(shí)時(shí)地切換到不同速率的算法進(jìn)行語(yǔ)音通信，具有很好的通用性和靈活性。

１聲碼器系統的結構和原理聲碼器通信系統是建立在通用的ＭＯＤＥＭ平臺上的，可以按照２．４ｋｂｐｓ、１．２ｋｂｐｓ和０．６ｋｂｐｓ中的任一個(gè)速率實(shí)現全雙工語(yǔ)音通信。圖１為整個(gè)通信系統的原理框圖。ＭＯＤＥＭ平臺負責對數字碼流進(jìn)行調制解調和通信，聲碼器則負責按照ＭＯＤＥＭ的要求對語(yǔ)音進(jìn)行編解碼。ＭＯＤＥＭ把話(huà)筒提供的模擬語(yǔ)音送給聲碼器編碼并將聲碼器的解碼語(yǔ)音送給聽(tīng)筒。ＭＯＤＥＭ還負責給聲碼器提供碼流傳送時(shí)鐘，聲碼器則按照這個(gè)時(shí)鐘與ＭＯＤＥＭ交換數字碼流。另外，ＭＯＤＥＭ和聲碼器之間還有一些控制信號線(xiàn)用來(lái)彼此交換狀態(tài)信息。表１是ＭＯＤＥＭ和聲碼器之間的主要接口關(guān)系。表1 MODEM和聲碼器的主要接口名字方向功能 AinMODEM至聲碼器模擬語(yǔ)音輸入Aout聲碼器至MODEM模擬語(yǔ)音輸出CLKMODEM至聲碼器碼流傳送時(shí)鐘，聲碼器按照CLK的頻率進(jìn)行編解碼TXD聲碼器至MODEM聲碼器至MODEM的數據線(xiàn)，在CLK的下降沿有效RXDMODEM至聲碼器MODEM至聲碼器的數據線(xiàn)，在CLK的上升沿有效PTTMODEM至聲碼器PCM碼有效標志RTS聲碼器至MODEM發(fā)送碼流有效標志CDMODEM至聲碼器接收碼流有效標志雖然ＭＯＤＥＭ可以根據網(wǎng)絡(luò )條件和外界要求自動(dòng)改變速率，但是卻沒(méi)有專(zhuān)門(mén)的信號線(xiàn)用來(lái)通知聲碼器進(jìn)行速率轉換。注意到碼流傳送時(shí)鐘ＣＬＫ是根據速率要求實(shí)時(shí)變化的，所以聲碼器通過(guò)檢測ＣＬＫ的頻率就可以得到當前的速率轉換信息。聲碼器的核心部分是一片ＴＭＳ３２０ＶＣ５４１６ＤＳＰ芯片，負責編解碼和控制工作。另外，還有一片ＴＩ公司生產(chǎn)的ＴＬＣ３２０ＡＩＣ１０芯片，負責語(yǔ)音的數模／模數（ＡＤ／ＤＡ）轉換；一片ＦＰＧＡ，負責數字邏輯轉換；一片２Ｍｂｉｔ容量的８位ＦＬＡＳＨ存儲器２９ＬＶ０２０，負責存儲所有程序和數據并在上電時(shí)加載到ＤＳＰ的片內ＲＡＭ上。聲碼器還有一個(gè)軟件狗對系統工作狀態(tài)進(jìn)行實(shí)時(shí)監控，并在需要時(shí)對整個(gè)聲碼器進(jìn)行復位。圖２是聲碼器的原理框圖。當ＭＯＤＥＭ需要聲碼器進(jìn)行編碼時(shí)，它通過(guò)ＰＴＴ信號通知聲碼器，并同時(shí)向聲碼器發(fā)送模擬語(yǔ)音信號。聲碼器利用其中的ＡＤ／ＤＡ芯片將其采樣量化為ＰＣＭ數字信號送給ＤＳＰ，ＤＳＰ則根據ＭＯＤＥＭ提供的時(shí)鐘信號ＣＬＫ的頻率選擇不同速率的編碼算法對輸入ＰＣＭ信號進(jìn)行編碼，然后把碼流通過(guò)ＴＸＤ送回給ＭＯＤＥＭ，并同時(shí)通過(guò)ＲＴＳ信號通知ＭＯＤＥＭ碼流有效，ＭＯＤＥＭ就可以將碼流進(jìn)行調制并發(fā)送。接收時(shí)，

也是由ＭＯＤＥＭ解調出碼流后按照ＣＬＫ的頻率通過(guò)ＲＸＤ發(fā)給聲碼器，并同時(shí)通過(guò)ＣＤ信號通知聲碼器碼流有效，聲碼器則對接收的碼流進(jìn)行解碼，并利用ＡＤ／ＤＡ將解碼后的ＰＣＭ語(yǔ)音轉換為模擬語(yǔ)音信號送回ＭＯＤＥＭ。據此就可以設計出聲碼器的工作流程，如圖３所示。其中的幀同步捕捉指的是對接收到的碼流的分幀工作，因為ＳＥＬＰ是基于幀結構的編解碼算法，所以在解碼之前需要先利用幀同步算法捕捉到每幀的起始位置。這里采用的是基于計數器的幀同步捕捉算法。另外，由于聲碼器的碼流收發(fā)都是按照ＣＬＫ頻率連續進(jìn)行的，而基于幀結構的ＳＥＬＰ編解碼器對碼流的輸入輸出卻是每幀進(jìn)行一次的，所以對于發(fā)送和接收碼流都需要設置循環(huán)緩沖區并對每個(gè)緩沖區設置一讀一寫(xiě)兩個(gè)指針。這兩個(gè)指針間的距離應大于一倍幀長(cháng)。但由于聲碼器中給ＡＤ／ＤＡ提供采樣時(shí)鐘的晶振有一定誤差，所以導致這兩個(gè)指針移動(dòng)速度不同。以輸入碼流緩沖區為例，其讀指針應由ＳＥＬＰ編碼器控制，而編碼器被調用的頻率由本地晶振的頻率決定，所以讀指針的移動(dòng)速度由本地晶振控制。寫(xiě)指針則是由碼流輸入部分控制，其移動(dòng)速度實(shí)際上是由對方的解碼速度決定的，也就是受對方聲碼器的晶振控制。所以在編碼后和解碼前都需要進(jìn)行指針調整，也就是檢查碼流緩沖區的讀寫(xiě)指針間距，并根據需要丟棄一幀或復制一幀。聲碼器設計和實(shí)現中的主要難點(diǎn)在于硬件接口的設計和ＦＬＡＳＨ上電加載部分，下面分別進(jìn)行介紹。２硬件接口的設計ＴＭＳ３２０ＶＣ５４１６片上有三個(gè)多通道緩沖串口（ＭＣＢＳＰ），每個(gè)ＭＣＢＳＰ都可以作為串口使用或被初始化成通用Ｉ／Ｏ口使用。其中，ＭＣＢＳＰ０按照串口的工作方式與ＡＤ／ＤＡ相連，這部分比較簡(jiǎn)單，按照典型的連接方式即可實(shí)現。但是碼流收發(fā)部分則不同，因為這部分只有一根同步時(shí)鐘線(xiàn)ＣＬＫ和輸入輸出兩根數據線(xiàn)，所以很難直接利用ＭＣＢＳＰ按串口方式實(shí)現收發(fā)。于是把ＭＣＢＳＰ１初始化成通用Ｉ／Ｏ，將ＲＸＤ與Ｉ／Ｏ口輸入腳ＤＲ１相連，ＴＸＤ與Ｉ／Ｏ口的輸出腳ＤＸ１相連，將ＣＬＫ與初始化為Ｉ／Ｏ口的輸入腳ＦＳＲ１相連。這樣在程序中就可以很方便地隨時(shí)讀寫(xiě)這三根信號線(xiàn)，再將時(shí)鐘中斷的頻率設為５０ｋＨｚ（遠高于ＣＬＫ可能出現的最高頻率２．４ｋＨｚ），就可以在時(shí)鐘中斷中實(shí)時(shí)監測ＣＬＫ的變化。若發(fā)現ＣＬＫ的上升沿則讀?。遥兀牡臓顟B(tài)并存入碼流接收緩沖區，若發(fā)現ＣＬＫ的下降沿則從碼流發(fā)送緩沖區取出１ｂｉｔ送至ＴＸＤ。這樣就成功地實(shí)現了碼流的收發(fā)。ＭＣＢＳＰ１被初始化為通用Ｉ／Ｏ后一共能提供６根Ｉ／Ｏ引腳線(xiàn)，除去碼流收發(fā)占用的３根之外還有３根，正好可以用來(lái)連接ＰＴＴ、ＲＴＳ和ＣＤ信號線(xiàn)。這樣，就可以在占用最少的ＤＳＰ資源的情況下實(shí)現碼流收發(fā)和控制功能。另一個(gè)主要問(wèn)題就是速率的自適應問(wèn)題，也就是說(shuō)，聲碼器必須能夠根據ＣＬＫ的頻率自動(dòng)選擇合適的編解碼算法。在上述連接方式下，這個(gè)問(wèn)題也就很容易解決了，只需設立一個(gè)計數器，對ＣＬＫ的每個(gè)周期中發(fā)生的時(shí)鐘中斷個(gè)數進(jìn)行計數即可。這樣，根據計數值就可以很方便地計算出ＣＬＫ的頻率。例如，時(shí)鐘中斷的頻率是５０ｋＨｚ，那么當ＣＬＫ的頻率是２．４ｋＨｚ時(shí)，計數器的值就應該在５０／２．４＝２０．８左右，當ＣＬＫ的頻率是１．２ｋＨｚ時(shí)，則在４１．７左右；當ＣＬＫ的頻率是０．６ｋＨｚ時(shí)，則在８３．３左右。從圖２的流程中可以看出，在程序初始化前就需要檢測ＣＬＫ頻率，并根據ＣＬＫ的頻率選擇合適的編解碼算法，進(jìn)行相應的初始化。在程序的執行過(guò)程中也要對ＣＬＫ的頻率進(jìn)行實(shí)時(shí)監測，若發(fā)現頻率改變就立即重新初始化聲碼器。這樣就能夠保證聲碼器實(shí)時(shí)地跟蹤ＣＬＫ的變化，實(shí)現自適應速率切換。對于軟件狗所需的周期變化信號，則通過(guò)ＤＳＰ上的輸出引腳ＸＦ給出，并在程序中及時(shí)翻轉ＸＦ的電平得到。３上電加載部分（Ｂｏｏｔｌｏａｄ）的實(shí)現ＴＭＳ３２０ＶＣ５４１６ＤＳＰ片內ＲＯＭ中有固化的自加載程序（Ｂｏｏｔｌｏａｄｅｒ），但它對被加載程序的大小有限制。在使用８ｂｉｔＦＬＡＳＨ的情況下，只能加載小于１６ＫＷｏｒｄ的內容。而三個(gè)速率的ＳＥＬＰ算法程序區和數據區的總數據量遠遠超過(guò)１６ＫＷｏｒｄ，顯然只使用ＤＳＰ片內的Ｂｏｏｔｌｏａｄｅｒ是不能滿(mǎn)足需要的。所以必須自己寫(xiě)加載程序。首先由ＴＭＳ３２０ＶＣ５４１６片內的Ｂｏｏｔｌｏａｄｅｒ把自己寫(xiě)的加載程序加載到片內ＲＡＭ，然后執行這段加載程序，加載其它部分。這里需要解決的一個(gè)主要問(wèn)題就是ＦＬＡＳＨ數據和ＤＳＰ地址空間的映射關(guān)系。由于ＳＥＬＰ算法的程序數據總量很大，所以必須用到片內擴展的程序區，也就是說(shuō)ＭＰ／ＭＣ標志位需設為０。從此時(shí)的ＭｅｍｏｒｙＭａｐ中可以看出，ＤＳＰ可以訪(fǎng)問(wèn)的每塊連續片外地址空間只有３２Ｋ，所以ＦＬＡＳＨ數據只能按照每頁(yè)３２Ｋ的方式分頁(yè)映射到ＤＳＰ地址空間。使用ＦＰＧＡ可以很方便地控制哪頁(yè)ＦＬＡＳＨ數據映射到ＤＳＰ中，這部分的原理框圖如圖４所示。

ＦＬＡＳＨ的低１５根地址線(xiàn)Ａ０～Ａ１４直接接到ＤＳＰ上，而高３根地址線(xiàn)Ａ１５～Ａ１７則由ＦＰＧＡ控制。在ＤＳＰ向Ｉ／Ｏ空間的特定地址寫(xiě)數時(shí)，ＦＰＧＡ內部的邏輯電路就會(huì )將Ｄ０～Ｄ２（也就是所寫(xiě)數據的低３位）鎖存到Ａ１５～Ａ１７上。這樣就實(shí)現了軟件控制ＦＬＡＳＨ數據映射關(guān)系的功能。再把所有的數據進(jìn)行合理的劃分和排列，燒入ＦＬＡＳＨ中，就可實(shí)現全部程序的自加載。由于采用獨特的硬件接口方式，很方便地實(shí)現了自適應變速率的功能，大大提高了聲碼器的靈活性和適用范圍。ＴＭＳ３２０ＶＣ５４１６擁有很大的片內ＲＡＭ，本文提出的使用ＦＰＧＡ輔助完成大數據量程序上電自加載的方法對于ＴＭＳ３２０ＶＣ５４１６的其它應用場(chǎng)合也同樣適用。使用以上方法實(shí)現的自適應變速率ＳＥＬＰ聲碼器在ＴＭＳ３２０ＶＣ５４１６上占用的硬件資源情況如表２所示。表2 硬件資源占用情況　運算量（峰值）（MIPS）存儲量（KWords）程序區數據區公共單獨2.4kbps算法43.011.411.65.41.2kbps算法52.425.00.6kbps算法35.427.4總運算量＝ＭＡＸ（４３．０，５２．４，３５．４）＝５２．４ＭＩＰＳ總存儲量＝１１．４＋１１．６＋５．４＋２５．０＋２７．４＝８０．８ＫＷｏｒｄ該聲碼器已在實(shí)際通信系統中獲得應用并表現出了很好的性能。

新聞中心

基于TMS320VC5416的自適應變速率聲碼器

評論

相關(guān)推薦

技術(shù)專(zhuān)區