視頻監視領(lǐng)域的視頻壓縮與數據流
就因特網(wǎng)協(xié)議視頻監視系統 (VSIP) 而言,處理網(wǎng)絡(luò )流量的硬件是攝像頭系統的重要組成部分,因為視頻信號要通過(guò)攝像頭進(jìn)行數字化、壓縮處理,然后才傳輸到視頻服務(wù)器,從而解決網(wǎng)絡(luò )的帶寬限制問(wèn)題。DSP/GPP 等異構處理器架構有助于最大化系統性能。視頻采集、存儲和視頻流都是中斷密集型 (Interrupt intensive) 任務(wù),我們可將其分配給 GPP 來(lái)處理,而高密度 MIPS 視頻壓縮工作則交給 DSP 去完成。數據傳輸給視頻服務(wù)器后,服務(wù)器將壓縮視頻流作為文件存儲在硬盤(pán)驅動(dòng)器上,從而避免了像傳統模擬存儲設備那樣出現視頻質(zhì)量下降問(wèn)題。我們針對數字視頻信號的壓縮技術(shù)開(kāi)發(fā)了多種標準,可分為以下兩大類(lèi):
* 運動(dòng)估算 (ME) 法:每 N 幀為一個(gè)圖像組 (GOP)。我們對圖像組中的第一幀進(jìn)行獨立編碼,而對其它 (N-1) 幀來(lái)說(shuō),我們只將當前幀與其前面已編碼的幀(即前向參考幀)的時(shí)差加以編碼。常用的標準為 MPEG-2、MPEG-4、H.263 及 H.264。
* 靜態(tài)影像壓縮法:每個(gè)視頻幀作為靜態(tài)影像獨立編碼。最常用的標準為 JPEG。MJPEG 標準采用 JPEG 算法對每個(gè)幀進(jìn)行編碼。
運動(dòng)估算法與靜態(tài)影像壓縮法的比較
圖 1 顯示了 H.264 編碼器的結構圖。與其它 ME 視頻編碼標準類(lèi)似,H.264 編碼器將輸入影像分為多個(gè)16 x 16 像素的宏塊 (MB) ,然后逐塊處理。H.264 編碼器包括正向路徑和重構路徑。正向路徑將幀編碼為比特位;重構路徑從編碼位中產(chǎn)生一個(gè)參考幀。下圖中的 IDCT、IQ、 ME 和 MC分別代表(反向)離散余弦變換、(反向)量化、運動(dòng)估算及運動(dòng)補償。
![]() |
圖 1:H.264 編碼器結構圖。 |
在正向路徑中(從 DCT至 Q),每個(gè)宏塊 (MB) 均可以幀內模式或幀間模式編碼。在幀間模式下,運動(dòng)估算 (ME) 模塊將參考 MB 位于前面已編碼的幀處;而在幀內模式下,參考MB 在當前幀中由采樣形成。
重構路徑 (從 IQ 至 IDCT)的目的是確保編碼器和解碼器采用相同的參考幀生成影像。否則就會(huì )累積編碼器與解碼器間的誤差。
![]() |
圖 2:JPEG 編碼器結構圖。 |
圖 2 給出了 JPEG 編碼器結構圖。該編碼器將輸入影像分為多個(gè) 8x8 像素的模塊,然后逐個(gè)處理。每個(gè)模塊首先通過(guò) DCT 模塊,隨后量化器根據量化矩陣對 DCT 系數進(jìn)行取整。在此過(guò)程中,編碼質(zhì)量與壓縮比均可根據量化步驟調節。最后熵編碼器對量化器輸出進(jìn)行編碼,并生成 JPEG 影像。
由于連續視頻幀通常包括大量相關(guān)信息,因此 ME 方法可實(shí)現更高的壓縮比。舉例來(lái)說(shuō),就每秒 30 幀的標準 NTSC 分辨率而言,H.264 編碼器能以 2 mbps 的速度進(jìn)行視頻編碼,從而實(shí)現了平均壓縮比高達 60:1 的影像質(zhì)量。在影像質(zhì)量相同的情況下,MJPEG 的壓縮比則為10:1 至 15:1。
MJPEG 相對于 ME 方法有如下幾點(diǎn)優(yōu)勢。首先,JPEG 需要的計算量和功耗相對大幅降低。此外,大多數PC 都配置了 JPEG 影像專(zhuān)用的解碼及顯示軟件。如果記錄特定事件只需一幅或幾幅影像,比如人通過(guò)門(mén)口,那么 MJPEG 的效率會(huì )更高。如果網(wǎng)絡(luò )帶寬沒(méi)有保證,那么我們更傾向于采用 MJPEG 標準,因為某幀的丟失或延遲不會(huì )影響其它幀。而對于 ME 方法來(lái)說(shuō),某幀的延遲或丟失會(huì )導致整個(gè) GOP 的延遲或丟失,因為只有獲得前向參考幀 (previous reference frame) 才能對下一幀進(jìn)行解碼。
評論