視頻壓縮
視頻數據中存在著(zhù)大量的冗余, 即圖像的各像素數據之間存在極強的相關(guān)性。 利用這些相關(guān)性, 一部分像素的數據可以由另一部分像素的數據推導出來(lái), 結果視頻數據量能極大地壓縮, 有利于傳輸和存儲。 視頻數據主要存在以下形式的冗余。
1. 空間冗余
視頻圖像在水平方向相鄰像素之間、 垂直方向相鄰像素之間的變化一般都很小, 存在著(zhù)極強的空間相關(guān)性。 特別是同一景物各點(diǎn)的灰度和顏色之間往往存在著(zhù)空間連貫性, 從而產(chǎn)生了空間冗余, 常稱(chēng)為幀內相關(guān)性。
2. 時(shí)間冗余
在相鄰場(chǎng)或相鄰幀的對應像素之間, 亮度和色度信息存在著(zhù)極強的相關(guān)性。 當前幀圖像往往具有與前、 后兩幀圖像相同的背景和移動(dòng)物體, 只不過(guò)移動(dòng)物體所在的空間位置略有不同, 對大多數像素來(lái)說(shuō), 亮度和色度信息是基本相同的, 稱(chēng)為幀間相關(guān)性或時(shí)間相關(guān)性。
3. 結構冗余
在有些圖像的紋理區, 圖像的像素值存在著(zhù)明顯的分布模式。 如方格狀的地板圖案等。 已知分布模式, 可以通過(guò)某一過(guò)程生成圖像, 稱(chēng)為結構冗余。
4. 知識冗余
有些圖像與某些知識有相當大的相關(guān)性。 如人臉的圖像有固定的結構, 嘴的上方有鼻子, 鼻子的上方有眼睛, 鼻子位于臉部圖像的中線(xiàn)上。 這類(lèi)規律性的結構可由先驗知識得到, 此類(lèi)冗余稱(chēng)為知識冗余。
5. 視覺(jué)冗余
人眼具有視覺(jué)非均勻特性, 對視覺(jué)不敏感的信息可以適當地舍棄。 在記錄原始的圖像數據時(shí), 通常假定視覺(jué)系統是線(xiàn)性的和均勻的, 對視覺(jué)敏感和不敏感的部分同等對待, 從而產(chǎn)生了比理想編碼(即把視覺(jué)敏感和不敏感的部分區分開(kāi)來(lái)編碼)更多的數據, 這就是視覺(jué)冗余。 人眼對圖像細節、 幅度變化和圖像的運動(dòng)并非同時(shí)具有最高的分辨能力。
人眼視覺(jué)對圖像的空間分解力和時(shí)間分解力的要求具有交換性, 當對一方要求較高時(shí), 對另一方的要求就較低。 根據這個(gè)特點(diǎn), 可以采用運動(dòng)檢測自適應技術(shù), 對靜止圖像或慢運動(dòng)圖像降低其時(shí)間軸抽樣頻率, 例如每?jì)蓭瑐魉鸵粠?對快速運動(dòng)圖像降低其空間抽樣頻率。
另外, 人眼視覺(jué)對圖像的空間、 時(shí)間分解力的要求與對幅度分解力的要求也具有交換性, 對圖像的幅度誤差存在一個(gè)隨圖像內容而變的可覺(jué)察門(mén)限, 低于門(mén)限的幅度誤差不被察覺(jué), 在圖像的空間邊緣(輪廓)或時(shí)間邊緣(景物突變瞬間)附近, 可覺(jué)察門(mén)限比遠離邊緣處增大3~4倍, 這就是視覺(jué)掩蓋效應。
根據這個(gè)特點(diǎn), 可以采用邊緣檢測自適應技術(shù), 對于圖像的平緩區或正交變換后代表圖像低頻成分的系數細量化, 對圖像輪廓附近或正交變換后代表圖像高頻成分的系數粗量化; 當由于景物的快速運動(dòng)而使幀間預測編碼碼率高于正常值時(shí)進(jìn)行粗量化, 反之則進(jìn)行細量化。 在量化中, 盡量使每種情況下所產(chǎn)生的幅度誤差剛好處于可覺(jué)察門(mén)限之下, 這樣能實(shí)現較高的數據壓縮率而主觀(guān)評價(jià)不變。
6. 圖像區域的相同性冗余
在圖像中的兩個(gè)或多個(gè)區域所對應的所有像素值相同或相近, 從而產(chǎn)生的數據重復性存儲, 這就是圖像區域的相似性冗余。 在這種情況下, 記錄了一個(gè)區域中各像素的顏色值, 與其相同或相近的區域就不再記錄各像素的值。 矢量量化方法就是針對這種冗余圖像的壓縮方法。
7. 紋理的統計冗余
有些圖像紋理盡管不嚴格服從某一分布規律, 但是在統計的意義上服從該規律, 利用這種性質(zhì)也可以減少表示圖像的數據量, 稱(chēng)為紋理的統計冗余。
電視圖像信號數據存在的信息冗余為視頻壓縮編碼提供了可能。
6.1.2 視頻信號的數字化和壓縮
模擬電視信號(包括視頻和音頻)通過(guò)取樣、 量化后編碼 為二進(jìn)制數字信號的過(guò)程稱(chēng)為模數變換(A/D變換)或脈沖編碼調制(PCM, Pulse Coding Modulation), 所得到的信號也稱(chēng)為PCM信號, 其過(guò)程可用圖6-1(a)表示。 若取樣頻率等于fs、 用n比特量化, 則PCM信號的碼率為nfs(比特/s)。 PCM編碼既可以對彩色全電視信號直接進(jìn)行, 也可以對亮度信號和兩個(gè)色差信號分別進(jìn)行, 前者稱(chēng)為全信號編碼, 后者稱(chēng)為分量編碼。
PCM信號經(jīng)解碼和插入濾波恢復為模擬信號, 如圖6-1(b)所示, 解碼是編碼的逆過(guò)程, 插入濾波是把解碼后的信號插補為平滑、 連續的模擬信號。 這兩個(gè)步驟合稱(chēng)為數模變換(D/A變換)或PCM解碼。
圖 6-1 電視信號的數字化和復原
(a) A/D變換; (b) D/A變換
評論