H.264_AVC視頻編碼變換量化核實(shí)現

2 4×4整數變換量化核的優(yōu)化設計
為進(jìn)一步提高硬件運算速度,減少硬件開(kāi)銷(xiāo),設計中采用了如下優(yōu)化方法:
(1)在求取變換陣W=CXCT時(shí),根據變換的對稱(chēng)性,將X的列變換(矩陣左乘)與行變換(矩陣右乘)分開(kāi)實(shí)現,把二維變換分割為兩次一維變換,并采用快速堞形算法[4]來(lái)實(shí)現。一維變換的快速算法實(shí)現如圖1所示,其中的列變換可用如下算式表示:


對于每列變換,需要進(jìn)行8次加法和2次移位運算,而行變換則可根據矩陣轉置的性質(zhì)ABT=(BAT)T,將經(jīng)過(guò)列變換后的結果矩陣先進(jìn)行轉置,再采用相同的變換形式運算。這樣對4×4點(diǎn)數據做一次變換,只需通過(guò)8×8次加法和2×8次移位運算便可完成。
(2) 針對不同運算的位寬需要,設計專(zhuān)用的加法器和乘法器。本文對整數變換中的加法器采用三級流水線(xiàn)加法器,實(shí)現9位加法,每級流水線(xiàn)完成三位超前進(jìn)位加法,將邏輯延遲限制在三位加法器之內。圖2給出了9位加法器的流水線(xiàn)實(shí)現框圖。選用EPF10K10LC84-3作為適配器件,經(jīng)過(guò)Synplify Pro 7.3綜合,結果表明這種加法器具有較優(yōu)的最高工作頻率和硬件開(kāi)銷(xiāo)。如表2所示, 常規加法器的最高工作頻率為37.0MHz,消耗資源卻為28LC,而經(jīng)過(guò)優(yōu)化的三級流水線(xiàn)加法器在消耗資源增加不多的情況下,其最高工作頻率相比常規加法器提高了257%,達到94.5MHz。


評論