支持監控視頻高效壓縮與識別的IEEE 1857標準
摘要:我國技術(shù)專(zhuān)家為主研究制定的數字視頻編解碼技術(shù)標準AVS于2013年6月4日被國際電子電氣工程師協(xié)會(huì )(IEEE)標準化委員會(huì )頒布為IEEE 1857標準。該標準獨具特色的一個(gè)部分是針對視頻監控的監控檔次AVS-S2,編碼壓縮性能達到目前視頻監控業(yè)界主流使用的H.264(又稱(chēng)MPEG-4 AVC)標準的兩倍,而且在碼流層支持感興趣區域的自動(dòng)提取與表達。本文介紹了AVS-S2的制定過(guò)程、關(guān)鍵技術(shù)及其與其它標準的壓縮效率對比情況。
本文引用地址:http://dyxdggzs.com/article/146816.htm引言
視頻監控是繼數字電視、視頻會(huì )議之后的又一個(gè)重大視頻應用,而且日益成為“體量”最大的一個(gè)視頻系統:千千萬(wàn)萬(wàn)個(gè)攝像頭通過(guò)寬帶網(wǎng)絡(luò )聯(lián)系在一起,形成了一張覆蓋全球的“視聽(tīng)感知網(wǎng)”,從此人類(lèi)社會(huì )的運行狀態(tài)都被海量的攝像頭采集下來(lái)。對大量攝像頭采集的海量監控視頻有效傳輸、存儲、分析和識別是信息技術(shù)面臨的重大挑戰。
根據EMC委托IDC做的研究報告[1],2012年全球各種數據的總量為2.84ZB。到2020年,這個(gè)數字將上升到40ZB,IDC稱(chēng)之為“數字宇宙(Digital Universe)”?!皵底钟钪妗敝杏蟹治隼脙r(jià)值的部分才是目前熱議的“大數據(Big Data)”,IDC估計2012年的數據中“大數據”占23%,2020年這個(gè)比例將增長(cháng)到33%。據IDC測算,2010年“大數據”的一半是監控視頻。2015年,監控視頻所占比例會(huì )增長(cháng)到65%。2020年仍將處于絕對領(lǐng)先地位,占44%(其次是25%的交易數據、20%的醫療數據、10%的娛樂(lè )和社交媒體)。
按照IDC的上述測算,2020年將有5.8ZB的監控視頻需要進(jìn)行存儲、傳輸和分析。其中,中國所占比例將達到21%。也就是說(shuō),2020年在我國將有1.2ZB(12億TB)的監控視頻需要處理。這是一個(gè)什么樣的規模呢?據測算,人類(lèi)歷史上說(shuō)過(guò)的所有的話(huà)都數字化也就是5EB,1.2ZB是其240倍!
面對如此海量的監控視頻,需要對視頻編碼和分析技術(shù)進(jìn)行基礎性研究并實(shí)現重大突破。以北京為例,2008年奧運會(huì )前全市監控攝像頭數量就超過(guò)了五十萬(wàn)個(gè),每小時(shí)產(chǎn)生的視頻時(shí)長(cháng)就相當于中央電視臺建臺以來(lái)的所有庫存視頻。如果要在全市范圍內調度、使用這些視頻,即使全部采用當前的國家標準AVS或國際標準AVC/H.264,也需要500000(攝像頭)×10M(比特/秒/攝像頭)=5000Gbps的網(wǎng)絡(luò )帶寬,這是目前的網(wǎng)絡(luò )傳輸條件不可能支持的。這些監控視頻往往要存儲數周乃至數月,盡管是分散在各個(gè)單位和部門(mén),但整個(gè)北京為存儲監控視頻付出的存儲成本十分龐大。仍然按當前的視頻標準壓縮效率計算,每個(gè)小時(shí)產(chǎn)生的視頻總量仍達到500000(攝像頭)×3600(秒/小時(shí))×10M(比特/秒/攝像頭)=18000(Tb/小時(shí))=2.25(PB/小時(shí))。按照IDC對2012年存儲價(jià)格保守估計[1],北京市每小時(shí)存儲監控視頻的成本需要2800萬(wàn)元,一個(gè)月的成本就是200億。為了降低存儲代價(jià),往往只能以損失視頻質(zhì)量為代價(jià),但這是和監控視頻需要滿(mǎn)足識別需要這個(gè)根本目的相抵觸的。因此,從傳輸和存儲成本考慮,都需要研究更高壓縮效率的視頻編碼技術(shù)和標準。
2002年以前,我國的視頻壓縮一直直接采用國際視頻編碼標準。2002年后,為了支持國內音視頻產(chǎn)業(yè)的健康發(fā)展,規避?chē)H標準背后高額專(zhuān)利費當時(shí)已經(jīng)不斷出現的糾紛,工業(yè)和信息化部(原信息產(chǎn)業(yè)部)組織成立了數字音視頻編解碼技術(shù)標準工作組(簡(jiǎn)稱(chēng)AVS工作組)。此后,AVS工作組開(kāi)始起草自主知識產(chǎn)權的國家標準《信息技術(shù)先進(jìn)音視頻編碼》,并于2006年頒布為國家標準GB/T 20090.2-2006[4]。AVS的編碼效率與同期國際標準MPEG-4 AVC/H.264相當[5~6],在圖像質(zhì)量基本不損失的前提下對高清視頻的壓縮效率能達到150:1(以下談到壓縮效率時(shí)同此條件)。當然,有些視頻監控應用中用戶(hù)將壓縮效率參數設為600:1甚至更高,但圖像質(zhì)量損失嚴重,對后續的使用會(huì )帶來(lái)負面影響,例如圖像中對象識別率下降等。
從2007年開(kāi)始,AVS工作組開(kāi)始面向行業(yè)應用對GB/T 20090.2進(jìn)行了定向擴展,開(kāi)始制定面向視頻監控應用的伸展檔次(簡(jiǎn)稱(chēng)AVS-S),2009年起草完成。這個(gè)標準新增了面向視頻監控的一些技術(shù)特性,但在編碼效率這個(gè)核心指標方面并無(wú)明顯提高,總體上處在與H.264相當的水平。認識到只有大幅度超越國際標準H.264,才能大幅度降低監控系統成本,AVS工作組從2010年3月開(kāi)始啟動(dòng)了第二代視頻監控標準(AVS-S2)的制定工作。2013年6月,包括AVS-S2在內的AVS視頻編碼標準由IEEE頒布為編號1857的標準。
AVS-S2的編碼效率有了大幅度提升,主要是因為采用了背景建模技術(shù),對監控視頻的編碼效率比H.264/AVC、以及2006年發(fā)布的AVS標準性能提高了一倍,編碼效率達到300:1左右,達到當前最新國際標準H.265/HEVC同等的水平[7]。
AVS–S2新增背景建模技術(shù)和感興趣區域提取等兩項技術(shù),是國外任何其他編碼標準所沒(méi)有使用的。其中,背景建模技術(shù)同樣可以用于增強其他國際標準的編碼壓縮性能,例如H.265/HEVC。實(shí)驗表明,在H.265/HEVC參考軟件中加入AVS-S2背景建模技術(shù)后,針對監控視頻可以將其壓縮效率再提高一倍,達到600:1左右。目前,AVS工作組正在將這套方法應用到正在制定AVS2標準中(稱(chēng)為AVS2-S),預計在監控視頻編碼方面將比H.265/HEVC高一倍,這將是國際范圍內監控視頻編碼壓縮效率的最高水平。
監控視頻編碼標準發(fā)展歷程
視頻編碼研究的目標是通過(guò)各種技術(shù)手段大幅度降低視頻碼率,否則即使是單路數字視頻都難以正常傳輸。以高清晰度視頻為例,每秒鐘的數據量為 1920×1080×24比特×30幀每秒 = 1492992000比特每秒,約1.5Gbps,即使以今天的帶寬條件,傳輸這樣的一路視頻都耗資巨大,當時(shí)的通信條件便更加難以企及。因此,從1952年貝爾實(shí)驗室Cutler等人進(jìn)行DPCM (Differential Pulse Code Modulation)技術(shù)研究以來(lái),視頻編碼技術(shù)一直得到高度重視和持續研究?! ?/p>

上世紀80年代,為了數字電視和視頻通信的需要,國際標準組織開(kāi)始綜合已有技術(shù)成果來(lái)制定視頻編碼標準,形成了以塊為單元的預測加變換的混合編碼框架(block-based hybrid coding framework),并相繼出臺了ITU-T H.261/H.262/H.263/H.264視頻編碼建議和ISO/IEC MPEG-1/MPEG-2/MPEG-4視頻編碼標準。其中,國際標準化組織(ISO)和國際電工技術(shù)委員會(huì )(IEC)在1994年出臺的MPEG-2標準在數字電視領(lǐng)域得到了廣泛采用,壓縮效率可以達到75:1,可以把原來(lái)一路1.5Gbps的高清視頻流編碼壓縮到20Mbps左右。國際電信聯(lián)盟1995年出臺的H.263標準也是同一時(shí)代的技術(shù),在視頻會(huì )議領(lǐng)域得到廣泛應用。第一代數字視頻監控系統主要采用MPEG-2或H.263標準,某些系統出于實(shí)現成本考慮還對標準進(jìn)行了一定的簡(jiǎn)化。
2003年第二代視頻編碼技術(shù)國際標準發(fā)布。國際標準為ITU-T H.264和ISO/IEC MPEG-4 AVC,系同一套技術(shù)標準文本由兩個(gè)渠道出版[2~3]。因為前面提到的原因,我國在國際標準約一年之后制定出了自主知識產(chǎn)權的國家標準,并經(jīng)過(guò)芯片實(shí)現等產(chǎn)業(yè)化驗證后,于2006年2月頒布為《信息技術(shù)先進(jìn)音視頻編碼第二部分視頻》國家標準(國標號GB/T 20090.2-2006,通常簡(jiǎn)稱(chēng)為AVS視頻編碼標準)[4]。4個(gè)月后,微軟主導的VC-1視頻編碼標準由美國電影電視工程師協(xié)會(huì )SMPTE頒布為行業(yè)標準。這三個(gè)標準通常被稱(chēng)為第二代視頻編碼標準的三個(gè)代表,其編碼效率均比第一代提高了一倍,編碼壓縮效率達到150:1左右,即可以把一路高清視頻壓縮到10Mbps左右。第二代標準在數字電視和視頻通信領(lǐng)域得到應用后,也很快被視頻監控系統所采用。目前基于IP的網(wǎng)絡(luò )視頻監控系統,主要采用H.264標準。但廠(chǎng)商為了降低成本,往往會(huì )把標準中較為復雜的編碼工具剪裁掉,而不同廠(chǎng)商剪裁的方式又各不相同,因此雖然都號稱(chēng)基于H.264標準,但不同廠(chǎng)商的產(chǎn)品間之間是難以互聯(lián)互通,需要使用軟件或者硬件轉碼器進(jìn)行轉換。
攝像頭相關(guān)文章:攝像頭原理
評論