IPTV編解碼標準綜述
IPTV是一種利用寬帶網(wǎng),集互聯(lián)網(wǎng)、多媒體、通訊等多種技術(shù)于一體,向家庭用戶(hù)提供包括數字電視在內的多種交互式服務(wù)的嶄新技術(shù)。由于國際上固話(huà)運營(yíng)商都是從最近兩年才興起IPTV熱,所以至今也沒(méi)有一個(gè)國家在IPTV業(yè)務(wù)方面形成成熟標準,國內IPTV業(yè)務(wù)也同樣無(wú)標準可循。中國通信標準化協(xié)會(huì )(CCSA)IP與多媒體工作委員會(huì )IPTV特別工作組于2005年下半年成立,并啟動(dòng)了對IPTV標準的研究和制訂工作。參加IPTV特別工作組的單位幾乎包含了目前從事IPTV業(yè)務(wù)運營(yíng)、開(kāi)發(fā)和研究的國內外所有企業(yè)。
IPTV最重要的標準就是編解碼標準,編碼直接關(guān)系到解碼,解碼又會(huì )影響到機頂盒。標準化是產(chǎn)業(yè)化成功的前提,之所以目前尚沒(méi)有廠(chǎng)家大規模生產(chǎn)網(wǎng)絡(luò )機頂盒,一個(gè)重要原因就是沒(méi)有確定的標準支持。盡管IPTV編解碼標準有很多種,但在中國主要是采用MPEG-4、H.264技術(shù)以及中國提出的具有自主知識產(chǎn)權的標準AVS,國內企業(yè)面臨一場(chǎng)抉擇。
1 MPEG-4標準簡(jiǎn)介
運動(dòng)圖像專(zhuān)家組MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC14496)標準第一版本。同年年底MPEG-4第二版亦告底定,且于2000年年初正式成為國際標準。MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮算法,它是針對數字電視、交互式繪圖應用、交互式多媒體等整合及壓縮技術(shù)的需求而制定的國際標準。MPEG-4標準將眾多的多媒體應用集成于一個(gè)完整的框架內,旨在為多媒體通信及應用環(huán)境提供標準的算法及工具,從而建立起一種能被多媒體傳輸、存儲、檢索等應用領(lǐng)域普遍采用的統一數據格式。
MPEG-4的編碼理念是:MPEG-4標準同以前標準的最顯著(zhù)的差別在于它是采用基于對象的編碼理念,即在編碼時(shí)將一幅景物分成若干在時(shí)間和空間上相互聯(lián)系的視頻音頻對象,分別編碼后,再經(jīng)過(guò)復用傳輸到接收端,然后再對不同的對象分別解碼,從而組合成所需要的視頻和音頻。這樣既方便我們對不同的對象采用不同的編碼方法和表示方法,又有利于不同數據類(lèi)型間的融合,并且這樣也可以方便的實(shí)現對于各種對象的操作及編輯。
MPEG-4除采用第一代視頻編碼的核心技術(shù),如變換編碼、運動(dòng)估計與運動(dòng)補償、量化、熵編碼外,還提出了一些新的有創(chuàng )見(jiàn)性的關(guān)鍵技術(shù),并在第一代視頻編碼技術(shù)基礎上進(jìn)行了卓有成效的完善和改進(jìn)。下面重點(diǎn)介紹其中的一些關(guān)鍵技術(shù)。
?。?)視頻對象提取技術(shù)
MPEG-4實(shí)現基于內容交互的首要任務(wù)就是把視頻/圖像分割成不同對象或者把運動(dòng)對象從背景中分離出來(lái),然后針對不同對象采用相應編碼方法,以實(shí)現高效壓縮。因此視頻對象提取即視頻對象分割,是MPEG-4視頻編碼的關(guān)鍵技術(shù),也是新一代視頻編碼的研究熱點(diǎn)和難點(diǎn)。
盡管MPEG-4 框架已經(jīng)制定,但至今仍沒(méi)有通用的有效方法去根本解決視頻對象分割問(wèn)題,視頻對象分割被認為是一個(gè)具有挑戰性的難題,基于語(yǔ)義的分割則更加困難。目前進(jìn)行視頻對象分割的一般步驟是:先對原始視頻/圖像數據進(jìn)行簡(jiǎn)化以利于分割,這可通過(guò)低通濾波、中值濾波、形態(tài)濾波來(lái)完成;然后對視頻/圖像數據進(jìn)行特征提取,可以是顏色、紋理、運動(dòng)、幀差、位移幀差乃至語(yǔ)義等特征;再基于某種均勻性標準來(lái)確定分割決策,根據所提取特征將視頻數據歸類(lèi);最后是進(jìn)行相關(guān)后處理,以實(shí)現濾除噪聲及準確提取邊界。
(2)VOP視頻編碼技術(shù)
視頻對象平面(VOP,Video Object Plane)是視頻對象(VO)在某一時(shí)刻的采樣,VOP是MPEG-4視頻編碼的核心概念。MPEG-4在編碼過(guò)程中針對不同VO采用不同的編碼策略,即對前景VO的壓縮編碼盡可能保留細節和平滑;對背景VO則采用高壓縮率的編碼策略,甚至不予傳輸而在解碼端由其他背景拼接而成。這種基于對象的視頻編碼不僅克服了第一代視頻編碼中高壓縮率編碼所產(chǎn)生的方塊效應,而且使用戶(hù)可與場(chǎng)景交互,從而既提高了壓縮比,又實(shí)現了基于內容的交互,為視頻編碼提供了廣闊的發(fā)展空間。MPEG-4支持任意形狀圖像與視頻的編解碼。
(3)視頻編碼可分級性技術(shù)
隨著(zhù)因特網(wǎng)業(yè)務(wù)的巨大增長(cháng),在速率起伏很大的IP(Internet Protocol)網(wǎng)絡(luò )及具有不同傳輸特性的異構網(wǎng)絡(luò )上進(jìn)行視頻傳輸的要求和應用越來(lái)越多。在這種背景下,視頻分級編碼的重要性日益突出,其應用非常廣泛,且具有很高的理論研究及實(shí)際應用價(jià)值,因此受到人們的極大關(guān)注。
MPEG-4通過(guò)視頻對象層(VOL,Video Object Layer)數據結構來(lái)實(shí)現分級編碼。MPEG-4提供了兩種基本分級工具,即時(shí)域分級(Temporal Scalability)和空域分級(SpatialScalability),此外還支持時(shí)域和空域的混合分級。每一種分級編碼都至少有兩層VOL,低層稱(chēng)為基本層,高層稱(chēng)為增強層?;緦犹峁┝艘曨l序列的基本信息,增強層提供了視頻序列更高的分辨率和細節。
在隨后增補的視頻流應用框架中,MPEG-4提出了FGS(Fine Granularity Scalable,精細可伸縮性)視頻編碼算法以及PFGS(Progressive Fine Granularity Scalable,漸進(jìn)精細可伸縮性)視頻編碼算法。
FGS編碼實(shí)現簡(jiǎn)單,可在編碼速率、顯示分辨率、內容、解碼復雜度等方面提供靈活的自適應和可擴展性,且具有很強的帶寬自適應能力和抗誤碼性能。但還存在編碼效率低于非可擴展編碼及接收端視頻質(zhì)量非最優(yōu)兩個(gè)不足。 PFGS則是為改善FGS編碼效率而提出的視頻編碼算法,其基本思想是在增強層圖像編碼時(shí)使用前一幀重建的某個(gè)增強層圖像為參考進(jìn)行運動(dòng)補償,以使運動(dòng)補償更加有效,從而提高編碼效率。
(4)運動(dòng)估計與運動(dòng)補償技術(shù)
MPEG-4采用I-VOP、P-VOP、B-VOP三種幀格式來(lái)表征不同的運動(dòng)補償類(lèi)型。它采用了H.263中的半像素搜索(half pixel searching)技術(shù)和重疊運動(dòng)補償(overlapped motioncompensation)技術(shù),同時(shí)又引入重復填充(repetitive padding)技術(shù)和修改的塊(多邊形)匹配(modified block (polygon)matching)技術(shù)以支持任意形狀的VOP區域。
此外,為提高運動(dòng)估計算法精度,MPEG-4采用了MVFAST(Motion Vector Field Adaptive Search Technique)和改進(jìn)的PMVFAST(Predictive MVFAST)方法用于運動(dòng)估計。對于全局運動(dòng)估計,則采用了基于特征的FFRGMET(Feature-based Fast and Robust Global Motion Estimation Technique)方法。
在MPEG-4視頻編碼中,運動(dòng)估計相當耗時(shí),對編碼的實(shí)時(shí)性影響很大。因此這里特別強調快速算法。運動(dòng)估計方法主要有像素遞歸法和塊匹配法兩大類(lèi),前者復雜度很高,實(shí)際中應用較少,后者則在H.263和MPEG中廣泛采用。目前有三種常用的匹配準則:(1)絕對誤差和(SAD, Sum of Absolute Difference)準則:(2)均方誤差(MSE, Mean Square Error)準則;(3)歸一化互相關(guān)函數(NCCF, Normalized Cross Correlation Function)準則。在上述三種準則中,SAD準則具有不需乘法運算、實(shí)現簡(jiǎn)單方便的優(yōu)點(diǎn)而使用最多,但應清楚匹配準則的選用對匹配結果影響不大。
在選取匹配準則后就應進(jìn)行尋找最優(yōu)匹配點(diǎn)的搜索工作。最簡(jiǎn)單、最可靠的方法是全搜索法(FS, Full Search),但計算量太大,不便于實(shí)時(shí)實(shí)現。因此快速搜索法應運而生,主要有交叉搜索法、二維對數法和鉆石搜索法,其中鉆石搜索法被MPEG-4校驗模型(VM, Verification Model)所采納。
評論