視頻壓縮技術(shù)的系統考慮
![]() |
圖 2:標準運動(dòng)補償視頻編碼 |
在視頻編解碼器中,單個(gè)幀可以采用三個(gè)模式中的一個(gè)進(jìn)行編碼 —— 即 I、P 或 B 幀模式(見(jiàn)圖 3)。幾個(gè)稱(chēng)為 Intra (I) 的幀單獨編碼,無(wú)需參考任何其他幀(無(wú)運動(dòng)補償)。某些幀可以利用 MC 編碼,以前一個(gè)幀為參考(前向預測)。這些幀稱(chēng)為預測幀 (P)。
B 幀或雙向預測幀通過(guò)之前的幀以及當前幀的后續幀進(jìn)行預測。B 幀的優(yōu)勢是能夠匹配堵塞在采用前向預測的上一幀中的背景區域。雙向預測通過(guò)平衡前向及后向預測可以降低噪聲。在編碼器中采用這種功能會(huì )要求更多處理量,因為必須同時(shí)針對前向及后向預測執行 ME,而這會(huì )明顯使運動(dòng)估計計算需求加倍。為了保存兩個(gè)參考幀,編碼器與解碼器都需要更多內存。B 幀工具需要更復雜的數據流,因為相對采集及顯示順序而言,幀不按順序解碼。這個(gè)特點(diǎn)會(huì )增加時(shí)延,因此不適合實(shí)時(shí)性較高的應用。B 幀不用于預測,因此可以針對某些應用進(jìn)行取舍。例如,在低幀速應用中可以跳過(guò)它們而不會(huì )影響隨后 I 與 P 幀的解碼。
![]() |
圖3:I、P 與 B 幀間預測圖示 |
6. 傳統視頻編碼標準
H.261
ITU 編制的 H.261[2] 標準是第一個(gè)主流視頻壓縮標準。它主要針對雙工視頻會(huì )議應用,是為支持 40kpbs~2Mbps 的 ISDN 網(wǎng)絡(luò )而設計的。H.261 支持 352(288 (CIF) 及 176(144 (QCIF) 分辨率,色度分辨率二次采樣為 4:2:0。由于可視電話(huà)需要同步實(shí)時(shí)編解碼,因此復雜性設計得較低。由于主要用于對延遲敏感的雙向視頻,因此 H.261 僅允許采用 I 與 P 幀,而不允許 B 幀。
H.261 采用基于塊的 DCT 進(jìn)行殘差信號的變換編碼。DCT 把像素的每個(gè) 8(8 塊映射到頻域,產(chǎn)生 64 個(gè)頻率成分(第一個(gè)系數稱(chēng)為 DC,其他的稱(chēng)為 AC)。為了量化 DCT 系數,H.261 在所有 AC 系數中采用固定的線(xiàn)性量化。量化后的系數進(jìn)行行程編碼,其可以按非零系數描述量化的頻率,后面跟隨一串零系數,在最后一個(gè)非零值之后以塊代碼結束。最后,可變長(cháng)度編碼 (Huffman) 將運行級別對 (run-level pair) 轉換成可變長(cháng)度編碼 (VLC),其比特長(cháng)度已針對典型概率分布進(jìn)行過(guò)優(yōu)化。
基于標準塊的編碼最終產(chǎn)生模塊化視頻。H.261 標準利用環(huán)路濾波避免這種現象。在模塊邊緣采用的簡(jiǎn)單 2D FIR 濾波器用于平滑參考幀中的量化效應。必須同時(shí)在編碼器及解碼器中精確地對每個(gè)比特應用上述濾波。
MPEG-1
MPEG-1[3] 是 ISO 開(kāi)發(fā)的第一個(gè)視頻壓縮算法。主要應用是數字媒體上動(dòng)態(tài)圖像與音頻的存儲與檢索,如速率為 1.15Mbps、采用 SIF 分辨率(352(240 - 29.97fps 或者 352(288 - 25 fps)的VCD。MPEG-1 與 H.261 相似,不過(guò)編碼器一般需要更高的性能,以便支持電影內容的較高運動(dòng)性而不是典型的可視電話(huà)功能。
與 H.261 相比,MPEG1 允許采用 B 幀。另外它還采用自適應感知量化,也就是說(shuō),對每個(gè)頻段采用單獨的量化比例因子(或等步長(cháng)),以便優(yōu)化人們的視覺(jué)感受。MPEG-1 僅支持逐行視頻,因此新標準——MPEG2 已經(jīng)開(kāi)始做出努力,同時(shí)支持分辨率及比特率更高的逐行與隔行視頻。
MPEG-2/H.262
MPEG-2[4] 專(zhuān)門(mén)針對數字電視而開(kāi)發(fā),很快成為了迄今最成功的視頻壓縮標準。MPEG-2 既能夠滿(mǎn)足標準逐行視頻的需求(其中視頻序列由一系列按一定時(shí)間間隔采集的幀構成),又能夠滿(mǎn)足電視領(lǐng)域常用的隔行視頻的需求。隔行視頻交替采集及顯示圖像中兩組交替的像素(每組稱(chēng)為一個(gè)場(chǎng))。這種方式尤其適合電視顯示器的物理特性。MPEG2 支持標準的電視分辨率,其中包括:針對美國和日本采用的 NTSC 制式隔行 720(480 分辨率,每秒 60 場(chǎng),以及歐洲和其他國家采用的PAL 制式的 720(576 分辨率,每秒 50 場(chǎng)。
MPEG-2 建立在 MPEG-1 基礎之上,并具備擴展功能,能支持隔行視頻及更寬的運動(dòng)補償范圍。由于高分辨率視頻是非常重要的應用,因此 MPEG-2 支持的搜索范圍遠遠大于 MPEG-1。與之前的標準相比,它顯著(zhù)提高了運動(dòng)估計的性能要求,并充分利用更寬搜索范圍與更高分辨率優(yōu)勢的編碼器需要比 H.261 和 MPEG-1 高得多的處理能力。MPEG2 中的隔行編碼工具包含優(yōu)化運動(dòng)補償的能力,同時(shí)支持基于場(chǎng)和基于幀的預測,而且同時(shí)支持基于場(chǎng)和基于幀的 DCT/IDCT。MPEG-2 在 30:1 左右的壓縮比時(shí)運行良好。MPEG-2 在 4-8Mbps 時(shí)達到的質(zhì)量適合消費類(lèi)視頻應用,因此它很快在許多應用中得到普及,如:數字衛星電視、數字有線(xiàn)電視、DVD 以及后來(lái)的高清電視等。
另外,MPEG-2 增加了分級視頻編碼工具,以支持多層視頻編碼,即:時(shí)域分級、空域分級、SNR 分級以及數據分割。盡管 MPEG-2 中針對分級視頻應用定義了相關(guān)類(lèi)別 (profile),不過(guò)支持單層編碼的主類(lèi) (Main Profile) 是當今大眾市場(chǎng)中得到廣泛應用的唯一 MPEG-2 類(lèi)。MPEG-2 通常稱(chēng)為 MPEG-2 主類(lèi)。
評論