視頻壓縮
本文引用地址:http://dyxdggzs.com/article/166500.htm
1. 奈奎斯特取樣定理
理想取樣時(shí), 只要取樣頻率大于或等于模擬信號中最高頻率的兩倍, 就可以不失真地恢復模擬信號, 稱(chēng)為奈奎斯特取樣定理。 模擬信號中最高頻率的兩倍稱(chēng)為折疊頻率。
2. 亞奈奎斯特取樣
按取樣定理, 若取樣頻率fs小于模擬信號最高頻率fmax的2倍會(huì )產(chǎn)生混疊失真, 但若巧妙地選擇取樣頻率, 令取樣后頻譜中的混疊分量落在色度分量和亮度分量之間, 就可用梳狀濾波器去掉混疊成分。
3. 均勻量化和非均勻量化
在輸入信號的動(dòng)態(tài)范圍內, 量化間隔幅度都相等的量化稱(chēng)為均勻量化或線(xiàn)性量化。 對于量化間距固定的均勻量化, 信噪比隨輸入信號幅度的增加而增加, 在強信號時(shí)固然可把噪波淹沒(méi)掉, 在弱信號時(shí), 噪波的干擾就十分顯著(zhù)。
為改善弱信號時(shí)的信噪比, 量化間距應隨輸入信號幅度而變化, 大信號時(shí)進(jìn)行粗量化, 小信號時(shí)進(jìn)行細量化, 也就是采用非均勻量化(或稱(chēng)非線(xiàn)性量化)。
非均勻量化有兩種方法, 一是把非線(xiàn)性處理放在編碼器前和解碼器后的模擬部分, 編、 解碼仍采用均勻量化, 在均勻量化編碼器之前, 對輸入信號進(jìn)行壓縮, 這樣等效于對大信號進(jìn)行粗量化, 小信號進(jìn)行細量化; 在均勻量化解碼器之后, 再進(jìn)行擴張, 以恢復原信號。 另一種方法是直接采用非均勻量化器, 輸入信號大時(shí)進(jìn)行粗量化(量化間距大) , 輸入信號小時(shí)細量化(量化間距小)。 也有采用若干個(gè)量化間距不等的均勻量化器, 當輸入信號超過(guò)某一電平時(shí)進(jìn)入粗間距均勻量化器, 低于某一電平時(shí)進(jìn)入細間距量化器, 稱(chēng)為準瞬時(shí)壓擴方式。
通常用Q表示量化, 用Q-1表示反量化。 量化過(guò)程相當于由輸入值找到它所在的區間號, 反量化過(guò)程相當于由量化區間號得到對應的量化電平值。 量化區間總數遠遠少于輸入值的總數, 所以量化能實(shí)現數據壓縮。 很明顯, 反量化后并不能保證得到原來(lái)的值, 因此量化過(guò)程是一個(gè)不可逆過(guò)程, 用量化的方法來(lái)進(jìn)行壓縮編碼是一種非信息保持型編碼。 通常這兩個(gè)過(guò)程均可用查表方法實(shí)現, 量化過(guò)程在編碼端完成, 而反量化過(guò)程則在解碼端完成。
對量化區間標號(量化值)的編碼一般采用等長(cháng)編碼方法。 當量化分層總數為K時(shí), 經(jīng)過(guò)量化壓縮后的二進(jìn)制數碼率為lbK比特/量值。 在一些要求較高的場(chǎng)合, 可采用可變字長(cháng)編碼如哈夫曼編碼或算術(shù)編碼來(lái)進(jìn)一步提高編碼效率。
6.1.3 ITU-R BT.601分量數字系統
數字視頻信號是將模擬視頻信號經(jīng)過(guò)取樣、 量化和編碼后形成的。 模擬電視有PAL、 NTSC等制式, 必然會(huì )形成不同制式的數字視頻信號, 不便于國際數字視頻信號的互通。 1982年10月, 國際無(wú)線(xiàn)電咨詢(xún)委員會(huì )(CCIR, Consultative Committee for International Radio)通過(guò)了第一個(gè)關(guān)于演播室彩色電視信號數字編碼的建議, 1993年變更為ITU-R(國際電聯(lián)無(wú)線(xiàn)電通信部分, International Telecommunications Union-Radio communications Sector)BT.601分量數字系統建議。
BT.601建議采用了對亮度信號和兩個(gè)色差信號分別編碼的分量編碼方式, 對不同制式的信號采用相同的取樣頻率13.5 MHz, 與任何制式的彩色副載波頻率無(wú)關(guān), 對亮度信號Y的取樣頻率為13.5 MHz。 由于色度信號的帶寬遠比亮度信號的帶寬窄, 對色度信號U和V的取樣頻率為6.75 MHz。 每個(gè)數字有效行分別有720個(gè)亮度取樣點(diǎn)和360×2個(gè)色差信號取樣點(diǎn)。 對每個(gè)分量的取樣點(diǎn)都是均勻量化, 對每個(gè)取樣進(jìn)行8比特精度的PCM編碼。
這幾個(gè)參數對525行、 60場(chǎng)/秒和625行50場(chǎng)/秒的制式都是相同的。 有效取樣點(diǎn)是指只有行、 場(chǎng)掃描正程的樣點(diǎn)有效, 逆程的樣點(diǎn)不在PCM編碼的范圍內。 因為在數字化的視頻信號中, 不再需要行、 場(chǎng)同步信號和消隱信號, 只要有行、 場(chǎng)(幀)的起始位置即可。 例如, 對于PAL制, 傳輸所有的樣點(diǎn)數據, 大約需要200 Mb/s的傳輸速率, 傳輸有效樣點(diǎn)只需要160 Mb/s左右的速率。
色度信號的取樣率是亮度信號取樣率的一半, 常稱(chēng)作4∶2∶2格式, 可以理解為每一行里的Y、 U、 V的樣點(diǎn)數之比為4∶2∶2。
6.1.4 熵編碼
熵編碼(Entropy Coding)是一類(lèi)無(wú)損編碼, 因編碼后的平均碼長(cháng)接近信源的熵而得名。 熵編碼多用可變字長(cháng)編碼(VLC, Variable Length Coding)實(shí)現。 其基本原理是對信源中出現概率大的符號賦以短碼, 對出現概率小的符號賦以長(cháng)碼, 從而在統計上獲得較短的平均碼長(cháng)。 所編的碼應是即時(shí)可譯碼, 某一個(gè)碼不會(huì )是另一個(gè)碼的前綴, 各個(gè)碼之間無(wú)需附加信息便可自然分開(kāi)。
1. 霍夫曼(Huffman)編碼
霍夫曼(Huffman)編碼是一種可變長(cháng)編碼, 編碼方法如圖6-2所示。
(1) 將輸入信號符號以出現概率由大至小為序排成一列。
(2) 將兩處最小概率的符號相加合成為一個(gè)新概率, 再按出現概率的大小排序。
(3) 重復步驟(2), 直至最終只剩兩個(gè)概率。
(4) 編碼從最后一步出發(fā)逐步向前進(jìn)行, 概率大的符號賦予“0”碼, 另一個(gè)概率賦予“1”碼, 直至到達最初的概率排列為止。
圖 6-2 霍夫曼(Huffman)編碼
評論