H.264/AVC中CAVLC編碼器的硬件設計實(shí)現
H.264/AVC是ITU-T和ISO聯(lián)合發(fā)布的國際視頻壓縮標準[1],比特壓縮率分別是MPEG-4、H.263及MPEG-2的39%、49%及64%[2],是一種高壓縮比的新標準?;趦热莸淖赃m應可變長(cháng)編碼(CAVLC)是H.264中關(guān)鍵技術(shù)之一,應用于H.264的基本檔次和擴展檔次對亮度和色度殘差數據塊進(jìn)行編解碼,編碼效率高,抗誤碼和糾錯能力強[3],但計算復雜度大,用軟件編碼難以滿(mǎn)足高清視頻實(shí)時(shí)性要求。H.264編碼過(guò)程不涉及任何浮點(diǎn)數運算,特別適合硬件電路實(shí)現。文獻[4]提出的CAVLC編碼可分成掃描和編碼2部分,掃描部分對殘差數據zig-zag逆序掃描后,提取出run-level標志以及相關(guān)信息提供給編碼部分進(jìn)行編碼。文獻[5]對掃描模塊進(jìn)行了優(yōu)化。編碼模塊中非零系數級(level)編碼計算量最大,復雜度最高。本文充分利用FPGA高速實(shí)時(shí)特點(diǎn),采用并行處理及流水線(xiàn)設計,通過(guò)優(yōu)化CAVLC編碼結構和level編碼子模塊,提高CAVLC編碼器的性能。
1 CAVLC原理
CAVLC是一種依據4×4塊變換系數的zig-zag掃描順序進(jìn)行的編碼算法。塊系數的非零系數幅值較小,主要集中在低頻段,經(jīng)過(guò)zig-zag掃描后,連續零的個(gè)數較多,采用run-level游程編碼,通過(guò)編碼5個(gè)語(yǔ)義元素能夠實(shí)現高效無(wú)損壓縮,編碼流程如圖1所示。zig-zag掃描后,順序編碼系數標記(coeff_token)。尾1的符號(trailing_ones_sign_flag)、除尾1外非零系數的級(level),最后一個(gè)非零系數前零的個(gè)數(total_zeros)和零的游程(run_before)。其中TC、T1、T0分別表示非零系數個(gè)數、尾1個(gè)數以及最后一個(gè)非零系數前零的個(gè)數。由于CAVLC編碼流程是串行的,軟件容易實(shí)現,但執行速度慢且效率低。
2 CAVLC編碼器硬件結構設計
2.1 并行化編碼結構
為了提高運算速度和效率,將圖1的CAVLC編碼流程并行化處理,適合FPGA實(shí)現。根據文獻[4]提出的思路,將CAVLC編碼分成掃描和編碼2部分,見(jiàn)圖2。由zig-zag逆序掃描、統計、編碼、碼流整合4個(gè)模塊組成。zig-zag模塊和統計模塊構成掃描部分,編碼模塊和碼流整合模塊構成編碼部分,系統采用狀態(tài)機控制。由于trailing_ones_sign_flag、level和run_before都是從zig-zag掃描后序列的尾部開(kāi)始編碼,所以本設計中zig-zag采用逆序掃描。統計模塊用計數器統計zig-zag逆序掃描輸出序列的TC、T1和T0,將尾1符號(T1_sign)、除尾1外的非零系數(coeffs)和零的游程(runbefore)存入緩存器并輸出。編碼模塊分成6個(gè)子模塊:NC生成模塊、coeff_token模塊、trailing_ones_sign_flag模塊、level模塊、total_zeros模塊以及run_before模塊。統計模塊給各編碼子模塊提供輸入數據,保證各編碼子模塊并行工作,減少了CAVLC編碼的時(shí)鐘周期,提高了編碼器執行效率。由于CAVLC編碼是變長(cháng)的,使得每個(gè)編碼子模塊的輸出碼流長(cháng)度不確定,各編碼子模塊的碼字寄存器寬度不同。為了保證各編碼子模塊生成的碼字能夠緊湊無(wú)縫鏈接和有效存儲,在各編碼子模塊的碼字輸出中嵌入輸出標志信號和碼長(cháng)信息,當輸出標志信號為高電平時(shí)碼字與碼長(cháng)有效,低電平時(shí)則無(wú)效,經(jīng)碼流整合模塊整合后輸出。
評論