MPEG-4視頻編碼技術(shù)在多媒體通信應用中的解決方案
一、引言
本文引用地址:http://dyxdggzs.com/article/226656.htmMPEG-4是運動(dòng)圖像專(zhuān)家組(MovingPictureEx-pertGroup)標準家庭中的一員,是國際標準化組織為多媒體通信制定的一種解決方案。當今迅速發(fā)展的交互式計算機游戲圖像顯示、交互式視頻點(diǎn)播(VOD)都表明電視正由“純線(xiàn)性”向“非線(xiàn)性”的方向發(fā)展。MPEG-1/2均是以音頻幀、視頻幀為編碼對象的,圖像中的AV(Audio、Video)對象所組成的場(chǎng)景不能與人們進(jìn)行交互。而MPEG-4的主要特點(diǎn)是對圖像中的內容進(jìn)行編碼,其具體的編碼對象就是圖像中的音頻和視頻信號,稱(chēng)為AV對象。MPEG-4就是圍繞著(zhù)AV對象的編碼、存儲、傳輸和組合而制定的。所以,MPEG-4有非線(xiàn)性電視的編碼、存儲、傳輸和組合的標準之稱(chēng)。
二、MPEG-4的圖像與視頻標準的技術(shù)結構
如圖1所示,底層是VLBV(VeryLowBitRateVideo)核心,它為5~64kbit/s視頻操作和應用提供算法與工具,支持較低的空間分辨率(低于352x288像素)和較低的幀頻(低于15 Hz)。VLBV核心支持的專(zhuān)用功能包括實(shí)時(shí)多媒體應用:支持矩形圖像序列的有效編碼,具有高編碼效率、高精度、高容錯度、低延時(shí)等特點(diǎn);以及多媒體數據庫應用:支持多媒體數據庫的存儲、隨機存取以及FF/FR(快進(jìn)/快退)等功能與操作。
MPEG-4的HBV(HighBitRateVideo)空間分辨率支持CIF-HDTV,碼率范圍在64 kbit/s~4 Mbit/s之間,同樣支持上述功能。三、MPEG-4視頻編碼標準與MPEG-1/2及其與H.26X的比較
MPEG-1/2/4視頻壓縮和H.26X視頻壓縮技術(shù)都是以DCT(離散全余弦變換)為基礎。但它們又各有不同的特點(diǎn)。
MPEG-1標準制定主要針對1.5Mbps以下數據傳輸率的數字存儲媒質(zhì)運動(dòng)圖像及其伴音編碼的國際標準,它用于在CD-ROM上存儲同步和彩色運動(dòng)視頻信號。采用SIF標準交換格式(對于NTSC制式為352×240,對于PAL制式為352×288)的圖像進(jìn)行壓縮,每秒能夠播放30幀,具有CD音質(zhì)。
MPEG-2標準追求的是CCIR601建議的圖像質(zhì)量DVB、HDTV和DVD等制定的3~10Mbps高質(zhì)量的運動(dòng)圖像及其伴音的編碼標準。MPEG-2可用于為廣播、有線(xiàn)電視網(wǎng)、電纜網(wǎng)絡(luò )以及衛星直播(DirectBroadcastSatellite)提供廣播級的數字視頻。
H.261的制定是適用于ISDN網(wǎng)的寬帶傳輸,它提供了P×64kbit/s的視聽(tīng)業(yè)務(wù)用的視頻編解碼。
H.263是適用于PSTN(公用電話(huà)網(wǎng))的窄帶通信信道的視頻編碼建議,可用于可視電話(huà)極低碼率的編解碼器,它是H.261的重要發(fā)展。
MPEG-4標準提供用于通信的新方式,其核心是基于內容的AV信息存儲及操作,支持交互性、高壓縮比及能用存儲性。同時(shí)它在結構上具有適應性和可擴展性,以適應軟硬件的迅速發(fā)展,及時(shí)融入新的技術(shù)。由于將內容和交互性作為MPEG-4的核心,就不再把具體的碼率范圍作為特別的要求,但低碼率依然是其一項基本內容,它在極低碼率的傳輸上與H.263具有一定的相似性,但是它也支持高質(zhì)量的視頻語(yǔ)音通信。所以,MPEG-4提供了一個(gè)更為廣闊的開(kāi)發(fā)平臺,更符合于多媒體通信的發(fā)展趨勢,具有更廣闊的應用前景。
四、MPEG-4為標準的多媒體傳輸系統
1.方案設計
基于以上的各視頻編碼標準的比較及實(shí)際應用的需要,我們設計了一套基于Internet網(wǎng)的多媒體通信系統。該系統的組成如圖2所示,主要包括多媒體信息處理模塊、TCP/IP通信協(xié)議模塊、通信接口模塊、控制模塊、外部設備接口及外部設備模塊(攝像頭、麥克風(fēng)、顯示器、揚聲器)。
2.各模塊功能及實(shí)現
(1)多媒體信息處理模塊
它主要基于MPEG-4標準,根據不同的應用要求對視頻和音頻數字信號進(jìn)行不同程度的壓縮/解壓縮。
1)視頻/音頻信號的壓縮
采用TI公司最新推出的TMS3206415DSP芯片,它支持圖像的8bit數據處理的指令。它的運算速度快,最高運行速度高達600MHz,指令周期最短為1.67ns,峰值處理速度達到了3 200~4800 MIPS.在音頻/視頻應用中,其性能提高15倍。具有先進(jìn)的超長(cháng)指令字結構(VLIW),獲得當前應用設備所需要的極高性能。內核的8個(gè)功能單元能夠在每個(gè)周期內執行4組16位MAC運算或8組8位MAC運算,以便在處理通信和影像算法中獲得最大的并行性。如果用C6415同時(shí)完成一個(gè)通道的MPEG-2視頻編碼、一個(gè)通道的MP
評論