MPEG-4視頻編碼技術(shù)在多媒體通信應用中的解決方案
采用MPGE-4標準,實(shí)現基于內容的編碼和編碼可分級性,其核心編碼器的結構如圖3所示:基本層采用的是MPEG-4基本模式編碼,并輸出基本視頻流,增強層的輸入信號是原始VOP和幀存(重建)的VOP的差值,并對其差值進(jìn)行8×8的DCT,然后對DCT系數進(jìn)行比特平面編碼。根據比特平面的重要性,將重要的比特放在碼流前端,如一個(gè)塊的MSB,將次要比特放在后端,比如一個(gè)塊的LSB,這樣在網(wǎng)絡(luò )發(fā)生擁塞時(shí)就可以先丟棄部分不重要的比特以減緩網(wǎng)絡(luò )負載,但解碼端對接收碼流仍可解碼,只是圖像質(zhì)量會(huì )有所下降。解碼器是編碼器的逆過(guò)程。
3)采用MPEG-4標準的視頻壓縮的特點(diǎn)
①傳統編碼與基于內容編碼的統一
MPEG-4視頻算法的核心是支持基于內容(Content-based)的編碼和解碼功能,也就是對場(chǎng)景中使用分割算法抽取的單獨的物理對象進(jìn)行編碼和解碼。為了實(shí)現預想的內容及交互等功能,MPEG-4引進(jìn)了一個(gè)叫做“視頻對象面”(VideoObjectPlane,簡(jiǎn)寫(xiě)為VOP)的概念,如圖4所示。圖4(a)表示支持MPEG-1和MPEG-2的普通MPEG-4編碼器,它把視頻圖像都認為是一個(gè)矩形區,圖4(b)表示MPEG-4的甚低碼率圖像(VLVB)的核心編碼器。它是假設每幀圖像被分割成許多任意形狀的對象,每個(gè)對象都有可能覆蓋描述場(chǎng)景中感興趣的物理對象或者內容,這被定義為VOP.然后單獨對VOP的形狀、運動(dòng)和紋理信息進(jìn)行編碼和傳送構成一個(gè)單獨的視頻對象層(VideoObject Layer,簡(jiǎn)寫(xiě)為VOL)。此外,還需要標識每個(gè)VOL的信息也包含在編碼后的比特流(Bitstream)中,也包括各種VOL的視頻圖像在接收端應該如何進(jìn)行重新組合的信息,以便重構完整的原始圖像序列。這樣就可以對每個(gè)VOP進(jìn)行單獨解碼,提供了管理視頻序列的靈活性。
如果輸入圖像序列只包含標準的矩形圖像,就不需要形狀編碼,在這種情況下,MPEG-4Video使用的編碼算法結構也就與MPEG-1和MPEG-2使用的算法結構相同。②實(shí)現編碼的連續可分級性
MPEG-4第4版針對Internet視頻流式傳輸的應用,定義了視頻圖像編碼的精細可分級性(FGS,即FineGranularityScalability)及其實(shí)現工具。由于FGS編碼提出了一個(gè)由網(wǎng)絡(luò )接收端來(lái)控制其所接收的碼流的概念,使其在Internet上的傳輸更具適應性。
在視頻的分級編碼技術(shù)中,視頻信息被分成多個(gè)不同重要性的層,其中基本層包含了視頻對象中最重要的基本信息,以此可以保證一個(gè)最基本的圖像質(zhì)量,在傳輸過(guò)程中被賦予較高的優(yōu)先級。增強層的作用是在基本層的基礎上進(jìn)一步提高圖像質(zhì)量,在傳輸中賦予較低的優(yōu)先級。這樣在網(wǎng)絡(luò )發(fā)生擁塞而丟包時(shí),就可以先丟棄優(yōu)先級較低的增強層,使得基本層發(fā)生丟包或誤碼的概率比增強層低,從而保證重建圖像仍然有一個(gè)讓人可以接受的質(zhì)量。
4)語(yǔ)音壓縮
采用CELP(CodeExcitedLinearPredication)碼激勵線(xiàn)性預測技術(shù)。傳統的CELP編碼器提供單一的碼率的壓縮,而本系統允許多種應用使用一個(gè)基本的編碼器,在碼率和帶寬上提供了可擴展性。根據不同應用需要可選擇8 kHz和16 kHz 2種采樣頻率,8kHz采樣頻率對應100~3 800 Hz帶寬的通信質(zhì)量,16 kHz采樣頻率對應50~7 000 Hz帶寬的通信質(zhì)量。
4)外部設備接口模塊
本系統采用的PHILIP公司的視頻編碼芯片SAA7111,對模擬攝像機的輸入模擬視頻信號進(jìn)行亮色分離,再對分離后的信號分別進(jìn)行8比特采樣。
評論