SVC/ROI技術(shù)提升數字攝影機設計
可延展視頻編碼(或稱(chēng)為可調性視頻編碼,SVC)早已是老生常談的話(huà)題,目前在市場(chǎng)上也能夠看到具有wavelet-base SVC(小波編碼為基礎的可延展視頻編碼)這一功能的實(shí)際芯片。不過(guò),市場(chǎng)上對這種技術(shù)還并不太熟悉,因此,本文將向大家介紹數字網(wǎng)絡(luò )攝影機用ASC8851(M2)芯片的一些新功能和與之相關(guān)的SVC-T及ROI技術(shù)。
SVC的優(yōu)勢
為何可延展視頻編碼會(huì )受到學(xué)術(shù)界與研究單位的重視?目前在應用上H.264格式已幾乎占據主導地位,但目前無(wú)論是DVR、NVR、IPC、DVS,還是視頻會(huì )議系統,都需要具有子碼流或是多碼流的編譯碼能力。同樣的內容分別被編成不同的分辨率,不同的比特率(或碼流),以及不同的幀率。這對編/譯碼器而言涵蓋了多種子碼流,它們都是比較大的負擔,不僅如此,在實(shí)際使用上,網(wǎng)絡(luò )帶寬、存儲容量和負載也都是額外的成本考慮。仔細斟酌,對于同樣的內容,為何我們不能只編一次就包含所有信息,按需獲取資源,其他不重要的部分直接把封包丟掉就好?如果我們能夠把影像資料有系統地排列,把重要部分和較不重要的部分在壓縮時(shí)用頭文件標示清楚,那么就太完美了!所有的影像一次壓縮到最高的分辨率并采用最高的比特率和最多的幀率,然后就能完成一切。在譯碼取用的時(shí)候或是往外部串流的時(shí)候,篩選封包依照所需的分辨率。在允許的帶寬范圍內提供最合適的幀率做串流或譯碼即可。這就是可延展視頻編碼的目標和功效。
什么是SVC-T
延展性視頻編碼在時(shí)間軸上的應用就是SVC-T,也就是前面說(shuō)到的對不同幀率上的應用。舉例而言,1080p@30fps的數據流無(wú)需重新編碼,而只需舍棄掉某些幀的數據,就可以譯碼成1080p@15fps,甚至是1080p@7.5fps的資料。同理,1080p@25fps到1080p@12.5fps,再到1080p@6.25fps,以此類(lèi)推均可。
SVC-T的原理
羅列了這些好處之后,就不得不介紹應該如何實(shí)現,圖1所示示意圖可方便大家了解。
以一個(gè)簡(jiǎn)單的GOP(圖像組)為例,I-P-P-P-I-P-P-P-I分別代表I幀和P幀在GOP內的排列順序,時(shí)間軸上從T0到T8代表幀-幀間編碼順序。圖1所示箭頭代表P幀所用的參考I幀關(guān)系,而不同的0~2層則代表不同幀率所需取用的編碼資料。
在最開(kāi)始的T0時(shí)刻先以I幀編碼,下一幀T1的P幀編碼以T0為參考幀,T2也以T0為參考幀做P幀編碼,T3以T2為參考幀做P幀編碼,T4又以I幀編碼,依照之前的順序重新做一輪新的GOP編碼。
在串流或是譯碼的時(shí)候,若是把所有的0~2層(包含T0~T8)I-P-P-P-I-P-P-P-I幀資料都拿來(lái)使用,就是25fps(或30fps);若把第2層的資料舍棄不用,則剩下0~1層的T0、T2、T4和T8就是一半的幀率12.5fps(或是15fps),如果只用第0層的T0、T4和T8,那么,幀率就將再減一半,即6.25fps(或7.5fps)。
SVC-T的其它注意事項
SVC-T可支持所有幀率減半和再減半及以此類(lèi)推的碼流。但是當幀率減半時(shí),碼流卻并未減半(可能只有變成原本的3/4)??梢岳斫?,因為I幀壓縮得較少,而P幀卻壓縮得較多。較高層所用均是P幀,而此時(shí)碼流相對較低。在SEI(補充增強信息)的語(yǔ)法里,可以記錄不同幀率下所需要的比特率,這樣,就可以視帶寬、譯碼能力與網(wǎng)絡(luò )狀況去決定需要用多少幀率(對應于多少層)的壓縮數據做串流或是譯碼。
SVC-T比分辨率與比特率上的可延展性視頻編碼更容易實(shí)現,可以在現有的基礎上增加NAL層語(yǔ)法而做特別標示,批注是0層、1層或是2層的資料,而這種特別批注會(huì )被舊有譯碼語(yǔ)言所忽略。因此,SVC-T所做的改動(dòng)最小,影響的層面也最小。這將發(fā)揮可延展性視訊編碼在節能(降低多余的編譯碼)和降低比特率(舍棄幀率)等方面的優(yōu)勢。雖然降低幀率可能會(huì )犧牲影像的流暢性,但如果能保證其在視覺(jué)可接受的范圍內,便將是在目前可延展性視頻編碼中最可行的方案。
目前的VLC免費軟件支持SVC-T譯碼,可以用圖2所示方式并加上svc-tlayer=#(#為層號)來(lái)開(kāi)啟串流(rtsp://172.17.208.9/live1.sdp?svc-tlayer=2)。
什么是ROI
ROI(感興趣的區域)簡(jiǎn)單來(lái)說(shuō)就是在視頻編碼時(shí)把感興趣的區域編得更細膩些,讓此區域的畫(huà)面能夠比其它區域顯示得更清楚。通常我們把整張畫(huà)面的主體放在ROI區域內,在相同的帶寬條件下更加突顯主體,將大部分的碼流花在壓縮主體的重要畫(huà)面上,而將小部分的碼流花在背景的影像壓縮上。
評論