<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 運用定點(diǎn)DSP實(shí)現MPEG-4標準中DCT系數快速量化的方法

運用定點(diǎn)DSP實(shí)現MPEG-4標準中DCT系數快速量化的方法

作者: 時(shí)間:2006-05-07 來(lái)源:網(wǎng)絡(luò ) 收藏

摘要:以運用TMS320C6200定點(diǎn)芯片完成MPEG-4標準中DCT系數量化為例,簡(jiǎn)要介紹MPEG-4標準的量化方法,提出一種用定點(diǎn)乘法和移位運算代替量化過(guò)程中的除法和飽和運算的方法,并實(shí)現了快速運算。

本文引用地址:http://dyxdggzs.com/article/242317.htm

關(guān)鍵詞:量化 DCT變換 定點(diǎn)芯片 MPEG-4

在基于DCT變換的圖像壓縮編碼方法中,對DCT系數必須做量化處理。量化過(guò)程是一個(gè)多對一的映射,例如對一個(gè)8×8塊的64個(gè)DCT變換系數分別除以量化步長(cháng)后取整。由于大多數DCT變換系數量化后變?yōu)榱?,因而達到壓縮的目的。由于在量化過(guò)程中用到除法,因此通常需要進(jìn)行浮點(diǎn)運算。

但是,可進(jìn)行浮點(diǎn)運算的器()芯片結構比定點(diǎn)DSP芯片復雜,價(jià)格一般也比定點(diǎn)DSP芯片高很多。所以數字圖像處理系統中通常采用定點(diǎn)DSP芯片來(lái)完成圖像壓縮運算,這種方法已經(jīng)成為數字圖像處理技術(shù)的的一個(gè)趨勢。

可用于數字圖像處理的比較好的定點(diǎn)DSP芯片有德州儀器公司新一代高性能定點(diǎn)DSP芯片TMS320C6200系列。它具有VLIW(Very Long Instruction Word)結構,由8個(gè)可并行運行的執行單元構成。這些單元使得該系列芯片在單周期內可以并行執行多條指令,例如在單周期內并行完成2個(gè)16位×16位乘法和2個(gè)移位操作。它還具有流水線(xiàn)結構,使得若干條指令的不同執行階段可以并行執行。這些設計使得TMS320C6200系列芯片程序執行速度更快、性能更高。如200MHx時(shí)鐘的TMS320C6201峰值性能可以達到1600MIPS。

在定點(diǎn)DSP上完成除法,通常的辦法是調用庫函數。但是調用庫函數,勢必會(huì )打破循環(huán)中的流水線(xiàn)操作,嚴重影響量化的完成速度。所以提高量化過(guò)程速度的關(guān)鍵就在于避免任何函數調用、跳轉等操作。

本文以TMS320C6200系列定點(diǎn)DSP為例,提出一種用定點(diǎn)乘法和移位運算來(lái)代替量化過(guò)程中除法和飽和運算的方法,從而極大地提高了量化過(guò)程的運行速度。該方法也同樣適用于其它各種定點(diǎn)微處理器。

1 MPEG-4標準中采用的量化技術(shù)及程序優(yōu)化

MPEG-4標準中定義了兩種量化方式:H.263量化方式和MPEG-4量化方式。這里為簡(jiǎn)單起見(jiàn),只介紹TMN2.0編碼器所用到的一種量化策略:AC系數和幀間宏塊的DC系數用H.263量化方式,而幀內宏塊的DC系數用MPEG-4量化方式中的DC系數非線(xiàn)性量化方式。

1.1 H.263量化方式

量化參數QP可以取值[1,3],量化步長(cháng)為2QP。則量化公式為:

對于幀內宏塊,LEVEL=|COF|/(2QP)

對于幀間宏塊,LEVEL=(|COF|-QP/2)/(2QP)式中,COF表示即將被量化的DCT變換系數,LEVEL表示量化結果的絕對值。

1.2 MPEG-4DC系數非線(xiàn)性量化方法

量化公式為:LEVEL=DC_COF//dc_scaler

式中,DC_COF表示即將被量化的DCT變換DC系數;LEVEL表示量化結果;//表示先進(jìn)行除法運算,然后對結果四舍五入取整。

在內部宏塊內,定義亮度塊為類(lèi)型 1塊,色差塊為類(lèi)型2塊,類(lèi)型1塊的C系數由類(lèi)型1的非線(xiàn)性標尺量化;類(lèi)型2的DC系數由類(lèi)型2的非線(xiàn)性標尺量化。

表1為定義DC非線(xiàn)性量化標尺dc_scaler。

表1 幀內宏塊DC系數標尺

類(lèi) 型量化參數(QP)范圍內的dc_scaler
1~45~89~2425~31
亮度:Type182QPQP+82QP-16
色度:Type28(QP+12)/2QP-6

從表1中可以看到亮度塊和色差塊的DC系數有獨立的量化標尺,亮度塊具有較大的標尺而色度塊具有較小的標尺。這種分段線(xiàn)性的非線(xiàn)性量化策略是一種高效的量化方式,它在保證圖像質(zhì)量的基礎上提高了壓縮效率。

1.3 將量化除法改定點(diǎn)乘法的方式

以?xún)炔亢陦K的AC系數量化公式為例,將其改寫(xiě)為:

LEVEL=|COF|/2QP=|COF|(2 n/2QP)/2 n

定義量化參數ac_cocff=[2n/2QP],[x]表示對x截尾取整,則:

LEVEL=|COF|×ac_coeff/2n

在QP的取值都范圍[1,31]內,要使截尾取整后的每一個(gè)2 n/2QP的值都能夠用量化參數ac_coeff一一對應地表示,n必須足夠大。通過(guò)計算得出:當n≥11時(shí)滿(mǎn)足要求。

取n=11得到ac_coeff的計算公式為:

ac_coeff=[2 11/2QP]

其實(shí)質(zhì)就是用一個(gè)字(32 bit)的低11位(0Q11)來(lái)表示1/2QP的小數部分。

由于QP在[1,31]之間,可以用上述公式計算出對應于幀內宏塊AC系數量化的量化系數的查找表:ac_coeff=AcQConff[QP]。用C語(yǔ)言表示為(假設QP=0時(shí)ac_coeff=0):

const short int AcQConeff[32]=

{0x000,0x400,0x200,0x155,0x100,0x0cc,0x0aa,0x092,

0x080,0x071,0x066,0x05d,0x055,0x04e,0x049,0x044,

0x040,0x03c,0x038,0x035,0x033,0x030,0x02e,0x02c,

0x02a,0x028,0x027,0x025,0x024,0x023,0x022,0x021};

計算表明,AC系數量化系數、亮度塊DC系數量化系數和色差塊DC量化系數都可以統一用一個(gè)字的低11位(0Q11)來(lái)表示。這樣就可以分別計算出它們的量化系數的查找表,從而實(shí)現用乘法運算代替除法運算。

而除以2 n的操作可以用右移n位的辦法來(lái)完成。

對于8bit無(wú)符號二進(jìn)制數表示的象素值,在經(jīng)過(guò)DCT變換后,其DCT變換系數的值域為[-2048,2047],最大有12位二進(jìn)制數。同時(shí),由上述分析可知量化系數最大有11位。所以DCT變換系數與量化系數相乘的結果最大將有11+12共23位。由于TMS320C62xDSP芯片中集成的乘法器是16位×16位的乘法器,乘法運算結果存放到32位的寄存器中。所以用本文方法計算出的量化系數與DCT變換系數相乘后,結果不會(huì )溢出。

根據MPEG-4 Visual標準TMN 2.0的要求,量化后AC系數值要飽和到[-2048,2047]之間。這可以利用TMS320C62x芯片指令集中的飽和左移指令SSHL來(lái)實(shí)現,只需兩條指令即可完成飽和運算,無(wú)需使用比較指令和跳轉指令。

下面給出內部宏塊量化的TMS320C62x線(xiàn)性匯編程序:

cmpeq type,1 //type定義的是當前塊的類(lèi)型

[type] ldh *+DcLumQCoeff[QP],dc_coeff //得到類(lèi)型1的DC系數的量化參數

[!type] ldh *+DcChromQCoeff[QP],dc_coeff //得到類(lèi)型2的DC系數的量化參數

lde *coeff[0],level //取出DCT變換DC系數

mpy level,dc_coeff,level //用乘法進(jìn)行量化

addk 0x400,level //加 0x400,對結果進(jìn)行四舍五入

shr level,11,level //右移11位

cmpgt level,maxDC,tmp //對量化后的DC系數進(jìn)行飽和運算

[tmp] mv maxDC,level //將其限制在[1,maxDC]之間cmplt level,1,tmp

[tmp] mvk 1,level

ldh *+AcQcoeff[QP],ac_coeff //得到AC系數的量化參數

mvk 63,cntr //63次循環(huán),只對AC系數進(jìn)行量化

loop: .trip 63 ldh *coeff++[1],cof //取出DCT變換AC系數

abs cof,level

mpy level,ac_coeff,level //對AC系數絕對值用乘法進(jìn)行量化

shru level,11,level //右移11位

cmplt cof,0,tmp

[tmp] neg level,result

[!tmp] mv level,result

sshl result,20,result //將量化后的AC系數值進(jìn)行飽和運算,

shru result,20,result //將結果限制在[-2048,2047]之間

sth result,*qcoeff++[1]

[cntr] sub cntr,1,cotr

[cntr] b loop

由該程序可以看到,程序中沒(méi)有任何會(huì )影響流水線(xiàn)的的跳轉語(yǔ)句及函數調用。因此將該程序編譯后會(huì )發(fā)現,此循環(huán)被優(yōu)化構成軟件流水。如果再使用其它一些優(yōu)化手段,比如合并程序中的移位指令,合作字訪(fǎng)問(wèn)指令一次處理兩個(gè)短型數據等,該程序的效率將會(huì )更高。我們用TMS320C62x軟件仿真器測試表明,原來(lái)使用除法的量化函數需要4871個(gè)周期,而運用上述優(yōu)化辦法進(jìn)行優(yōu)化后的量化函數只需275個(gè)周期即可完成,效率提高約18倍。

DCT/IDCT變換及量化過(guò)程是視頻圖像壓縮系統中的關(guān)鍵模塊。該模塊的執行速率對整個(gè)系統的處理流度影響很大,因此將量化過(guò)程中的浮點(diǎn)運算轉換為定點(diǎn)運行,提高該模塊在定點(diǎn)DSP芯片上的執行速度,其意義顯得尤為重要。同時(shí)由于目前絕大多數數字通訊系統都基于定點(diǎn)DSP芯片,如果用定點(diǎn)芯片完成視頻圖像處理將會(huì )有易于與數字通訊系統集成的優(yōu)點(diǎn)。我們的這一方法為在定點(diǎn)芯片上完成圖像處理進(jìn)行了有益的嘗試,為后續的研發(fā)工作打下了一個(gè)良好的基礎。



評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>