<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 基于A(yíng)RM946E處理器的MP3解碼優(yōu)化系統設計

基于A(yíng)RM946E處理器的MP3解碼優(yōu)化系統設計

作者: 時(shí)間:2011-12-10 來(lái)源:網(wǎng)絡(luò ) 收藏
MP3(MPEG I Audio Layer 3)格式是基于電影專(zhuān)家組系統(Motion Picture Expert Group,MPEG)壓縮標準的一種聲音文件格式,其壓縮比根據采樣頻率、壓縮位率和聲音模式的不同而有所變化。MP3具有很高的壓縮率,可以達到1:12。一分鐘左右的CD音樂(lè )經(jīng)過(guò)MP3格式壓縮編碼后,可以壓縮到1兆左右的容量,其音色和音質(zhì)還可以保持基本完整而不失真。隨著(zhù)數字音樂(lè )的不斷普及,現在MP3音樂(lè )已經(jīng)不僅局限于MPEG視頻應用中,而是以一種獨立的數字音樂(lè )壓縮技術(shù)出現在計算機、網(wǎng)絡(luò )和各種電子設備上。目前市場(chǎng)流行的MP3播放器是基于DSP和專(zhuān)用芯片的解決方案,通過(guò)硬件或專(zhuān)用算法實(shí)現解碼,具有良好的實(shí)時(shí)性。而消費類(lèi)電子產(chǎn)品正朝著(zhù)多功能、低成本的方向發(fā)展。隨著(zhù)ARM9功能的不斷增強,利用系統本身處理器實(shí)現MP3軟解碼成為可能。另外,軟件實(shí)現更便于產(chǎn)品功能的升級和維護,可以預見(jiàn),嵌入式MP3軟解碼器的應用將越來(lái)越廣泛。這里在分析MPEG I Audio Layer3解碼算法的基礎上,提出基于處理器實(shí)現解碼算法的軟件優(yōu)化方法。

1 MPEG Audio Layer3的解碼流程

MP3解碼算法流程如圖1所示。


主要過(guò)程包括:數據流解碼、Huffman解壓縮、反量化與重排序、立體聲解碼、IMDCT和子帶合成運算等。其中Huffman解碼與反量化、IMDCT和子帶合成等3個(gè)過(guò)程在MP3解碼過(guò)程中占用了最多的CPU和內存資源,是嵌入式系統實(shí)現軟件解碼的關(guān)鍵。

2 處理器

處理器屬于A(yíng)RM9內核帶有E擴展的一個(gè)可綜合版本,執行v5TE架構指令。采用5級流水線(xiàn),存儲器系統根據哈佛體系結構重新設計,獨立的數據和指令總線(xiàn)。帶有一套存儲器子系統,以提高系統性能和支持大型操作系統。

如圖2所示,存儲器子系統包含1個(gè)存儲器保護單元(MPU)、高速緩存(Cache)和寫(xiě)緩沖(Write Buffer);CPU通過(guò)該子系統與系統存儲器相連。

相對于A(yíng)RM7,ARM9E性能上的提高主要表現在工作頻率、改進(jìn)的硬件特性及優(yōu)化的指令執行效率。另外,ARM9E集成了輕量級的DSP處理能力,以很小的成本(CPU增加功能需要增加硬件)換來(lái)非常實(shí)用的DSP性能。充分利用好芯片資源是實(shí)現的關(guān)鍵。

3算法優(yōu)化

針對MP3中涉及較大運算的Huffman解碼與反量化、IMDCT和子帶合成,分別提出算法優(yōu)化處理。

3.1 定長(cháng)查找冗余表Huffman解碼算法

Huffman解碼器可以通過(guò)從頭至尾逐一檢測各符號,以查表比較的方式進(jìn)行解碼。即從一維的bit流中分辨出各個(gè)長(cháng)度不同的Huffman碼字,然后進(jìn)行復雜的匹配。

由于LayerⅢ中的Huffman碼表組長(cháng)度不一,會(huì )增加碼字的搜索時(shí)間。定長(cháng)查找冗余表法擴充Huff—man查找表,每次選取定長(cháng)N bit碼流作為查找索引。查找表中包括跳轉指針和編碼值。

若節點(diǎn)索引值為跳轉指針時(shí),將通過(guò)擴充Huffman查找表得知此Huffman編碼的后續bit數,并跳轉到另外一個(gè)節點(diǎn);然后再根據后續bit數從碼流中取值;接著(zhù)從上次跳轉節點(diǎn)開(kāi)始查找,如此重復直到找出對應huffman編碼的內容。查找表利用Union數據結構實(shí)現,可減小Huffman表占用的空間。假設一Huffman編碼長(cháng)度為1,采用傳統算法需要1次移位操作和1次比較,使用定長(cháng)查找法只需[l/N]次查找和[l/N]次比較操作。

表1,表2是Huffman解碼的舉例說(shuō)明:

若Huffman編碼為000000001010(內容為“DAB”),定長(cháng)N=3,即每次從碼流中取3 b數據,解碼步驟如下:

(1)取3 b數據000,從Huffman查找表檢索,000對應為指針類(lèi)型,指向表項號8,標志位為0,說(shuō)明沒(méi)有取到1個(gè)完整的Huffman編碼,后續仍有3 b數據;

(2)繼續取3 b數據000,從Huffman查找表的第8項開(kāi)始檢索,索引值為000對應的內容為“D”,此時(shí)標志位為1,即表示已完成1次Huffman解碼;

(3)取3 b數據001,對應表內的第1項,標志位為1說(shuō)明已取完該個(gè)Huffman編碼,表項內容為“A”;

(4)取3 b數據010,對應表內的第2項,表項內容為“B”。

至此,已完整從Huffman編碼“000000001010”解碼出“DAB”的內容。

3.2 IMDCT與合成子帶濾波的簡(jiǎn)化算法

反離散修正余弦變換(IMDCT)是在去混疊處理之后進(jìn)行的,它的計算公式如式(1)所示:


子帶合成濾波在解碼過(guò)程中包括了32點(diǎn)到64點(diǎn)的IMDCT處理,如式(3)所示:

由于N(i)(k)具有對稱(chēng)特性,可以得出:


只要計算0≤in/4和n/2+1≤i3n/4范圍的V(i)值即可。其減少了將近一半的計算量。

4代碼優(yōu)化

根據ARM946E處理器硬件特點(diǎn),對實(shí)時(shí)性要求較高的關(guān)鍵程序進(jìn)行C語(yǔ)言和ARM匯編級代碼優(yōu)化。

4.1減計數循環(huán)體

IMDCT和子帶合成濾波器組2個(gè)運算量最大部分中有多個(gè)循環(huán)體運算,為了提高執行效率,推薦使用減計數循環(huán)體。

如表3所示,對于固定次數的循環(huán),減計數循環(huán)比增計數循環(huán)速度快。這是因為每次增計數循環(huán)體外加3條指令,而減計數循環(huán)體外只有2條指令,減循環(huán)終止條件為減計數到零,而不是計數增加到某個(gè)特定的限制值。由于減計數結果已存儲在指令條件標志里,省去與零比較指令。


4.2 內聯(lián)函數和內嵌匯編

MP3解碼算法中定點(diǎn)化乘法都是通過(guò)函數調用來(lái)實(shí)現,每次調用需要開(kāi)銷(xiāo)23~28個(gè)時(shí)鐘周期,其中超過(guò)15個(gè)周期用于函數調用時(shí)PC指針以及寄存器壓棧保護上。采用內聯(lián)函數方式(使用關(guān)鍵字_inline聲明)或宏指令,在編譯階段代碼段將被直接展開(kāi)。另外armcc編譯器允許在C源程序中使用內嵌匯編(但代碼可移植性差),使用包括匯編的內嵌函數,可以使編譯器支持通常不能有效使用的ARM指令和優(yōu)化方法,例如C編譯器不支持的ARM v5E擴展指令。使用內聯(lián)函數結合內嵌匯編實(shí)現移位乘法,可使平均時(shí)鐘周期縮短為6~8個(gè)。

4.3 ARM DSP擴展指令的運用

ARM946E處理器支持ARM DSP擴展指令,主要包括3個(gè)類(lèi)型:

(1)單周期的16×16和32×16 MAC操作;
(2)對原有的算術(shù)運算指令增加了飽和處理擴展;
(3)前導零(CLZ)運算指令,提高歸一化、浮點(diǎn)運算以及除法操作的性能。

ARM處理器不支持浮點(diǎn)運算,經(jīng)過(guò)測試及分析,定點(diǎn)運算中數值的截斷誤差選擇為28 b,其可以達到較好的解碼音質(zhì),不會(huì )因為爆音過(guò)多而影響播放效果。

完成類(lèi)似的乘法功能,ARM的SMULL(32×32)指令需要3個(gè)周期,而ARM DSP擴展指令SMULWT(32×16)只需要1個(gè)周期。從數據的準確性上分析,由于乘數的精度為16 b,最終結果有些差異,但由于MP3解碼運算都是基于28 b的定點(diǎn)數值的,所以通常的運算都是一個(gè)運算結果跟某一個(gè)固定定點(diǎn)表中的數據相乘的。若選擇固定定點(diǎn)表中數據的高16 b數據進(jìn)行運算,運算的結果誤差在1 b以?xún)取?BR>
為了驗證使用ARM DSP擴展指令的優(yōu)化效果,在系統120 MHz主頻下,以128 Kb/s的壓縮速率進(jìn)行編碼測試,采用的測試文件如表4所示。


上述3個(gè)MP3測試文件的比特率均為128 Kb/s,使用這三首MP3歌曲進(jìn)行解碼分析結果如圖3所示。


實(shí)驗表明,使用ARM DSP擴展指令比使用ARM一般指令解碼性能平均提高17.5%,主觀(guān)聽(tīng)覺(jué)上音質(zhì)效果無(wú)差異。

5 結 語(yǔ)

這里充分利用ARM946E處理器的DSP擴展指令特點(diǎn)提高程序代碼的執行效率,對3個(gè)關(guān)鍵模塊:Huffman解碼,IMDCT運算,合成子帶濾波進(jìn)行算法優(yōu)化及簡(jiǎn)化處理,減少了各模塊的運算量,同時(shí)從C語(yǔ)言和ARM匯編層次來(lái)優(yōu)化代碼,取得了較好的實(shí)時(shí)MP3解碼效果。


關(guān)鍵詞: ARM946E MP3解碼優(yōu)化

評論


技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>