數字電視信源編碼的主要技術(shù)與標準淺析
準數字電視和數字高清晰度電視在內的數字電視體系的開(kāi)發(fā)研究正加緊進(jìn)行。信源編碼作為數字電視系統的核心構成部分,直接決定了數字電視的基本格式及其信號編碼效率,決定了數字電視最終如何在實(shí)際的系統中實(shí)現。為了減少信源輸出符號序列中的剩余度、提高符號的平均信息量,對信源輸出的符號序列所施行的變換。具體說(shuō),就是針對信源輸出符號序列的統計特性來(lái)尋找某種方法,把信源輸出符號序列變換為最短的碼字序列,使后者的各碼元所載荷的平均信息量最大,同時(shí)又能保證無(wú)失真地恢復原來(lái)的符號序列。
本文引用地址:http://dyxdggzs.com/article/149748.htm一、數字電視的信源編碼
數字電視信號在進(jìn)入傳輸通道前的處理過(guò)程一般如圖1所示:
電視信號在獲取后經(jīng)過(guò)的第一個(gè)處理環(huán)節就是信源編碼。信源編碼是通過(guò)壓縮編碼來(lái)去掉信號源中的冗余成分,以達到壓縮碼率和帶寬,實(shí)現信號有效傳輸的目的。信道編碼是通過(guò)按一定規則重新排列信號碼元或加入輔助碼的辦法來(lái)防止碼元在傳輸過(guò)程中出錯,并進(jìn)行檢錯和糾錯,以保證信號的可靠傳輸。
信源編碼的作用之一是設法減少碼元數目和降低碼元速率,即通常所說(shuō)的數據壓縮:作用之二是將信源的模擬信號轉化成數字信號,以實(shí)現模擬信號的數字化傳輸。
信源編碼的目的是通過(guò)在編碼過(guò)程中對原始信號冗余度的去除來(lái)壓縮碼率,因此壓縮編碼的技術(shù)與標準成為信源編碼的核心。MPEG-2壓縮編碼輸出的碼流作為數字電視信源編碼的標準輸出碼流已被廣泛認可。目前數字電視系統中信源編碼以外的其他部分,包括信道編碼,調制器,解調器等,大都以MPEG-2碼流作為與之適配的標準數字信號碼流。
二、數字演播室標準ITU-R601
Blackfin系列DSP專(zhuān)門(mén)針對高速數據吞吐集成了并行外圍接口(PPI),在傳統的數據總線(xiàn)的基礎上增加了一條數據吞吐通道。PPI接口:1)能以最高66 MHz 的頻率接收數據,以最高60 MHz 的頻率輸出數據;2)不再需要額外的數據輸入/輸出緩沖,直接連接高速AD/DA輸入輸出數據;3)能夠輸入或輸出ITU-R601/656 格式和帶行場(chǎng)同步時(shí)鐘的RGB格式的數字視頻。使用PPI接口輸入輸出數據,輔以強大的DMA流量控制和高速SDRAM,使BlackfinDSP的內核獨立于數據吞吐過(guò)程,充分發(fā)揮其密集運算能力,并簡(jiǎn)化了系統構架,在紅外視頻處理通用模塊中取得了良好的應用。
ITU-R601主要是一種取樣標準。模擬電視信號據此取樣后進(jìn)行8比特量化和線(xiàn)性PCM編碼,即可得到符合數字演播室標準的基帶數字信號。但是,由此得到的數字電視信號具有非常高的碼率和帶寬,難以進(jìn)入實(shí)用。雖然ITU-R601建議早在1980年已經(jīng)制定,但直到九十年代一系列有效的圖像數碼壓縮技術(shù)及相應的國際標準出現以后,數字電視才得到了迅速的發(fā)展。
圖像數據的壓縮主要基于對各種圖像數據冗余度及視覺(jué)冗余度的壓縮,包括如下一些方法:
1.統計冗余度的壓縮:對于一串由許多數值構成的數據來(lái)說(shuō),如果其中某些值經(jīng)常出現,而另外一些值很少出現,則這種由取值上的統計不均勻性就構成了統計冗余度,可以對之進(jìn)行壓縮。具體方法是對那些經(jīng)常出現的值用短的碼組來(lái)表示,對不經(jīng)常出現的值用長(cháng)的碼組來(lái)表示,因而最終用于表示這一串數據的總的碼位,相對于用定長(cháng)碼組來(lái)表示的碼位而言得到了降低。
視頻圖像在每一點(diǎn)的取值上具有任意性。對于運動(dòng)圖像而言,每一點(diǎn)在一段時(shí)間內能取可能的任意值,在取值上具有統計均勻性,難以直接運用熵編碼的方法,但可以通過(guò)適當的變換編碼的方法,如DCT變換,使原圖像變成由一串統計不均勻的數據來(lái)表示,從而利用霍夫曼編碼來(lái)進(jìn)行壓縮。
2.空間冗余度的壓縮:一幅視頻圖像相鄰各點(diǎn)的取值往往相近或相同,具有空間相關(guān)性,這就是空間冗余度。從頻域的觀(guān)點(diǎn)看,意味著(zhù)圖像信號的能量主要集中在低頻附近,高頻信號的能量隨頻率的增加而迅速衰減。通過(guò)頻域變換,可以將原圖像信號用直流分量及少數低頻交流分量的系數來(lái)表示,這就是變換編碼中的正交余弦變換DCT的方法。DCT是一種與傅立葉變換緊密相關(guān)的數學(xué)運算。在傅立葉級數展開(kāi)式中,如果被展開(kāi)的函數是實(shí)偶函數,那么其傅立葉級數中只包含余弦項,再將其離散化可導出余弦變換,因此稱(chēng)之為離散余弦變換。
視頻圖像中經(jīng)常出現一連串連續的象素點(diǎn)具有相同值的情況,典型的如彩條,彩場(chǎng)信號等。只傳送起始象素點(diǎn)的值及隨后取相同值的象素點(diǎn)的個(gè)數,也能有效地壓縮碼率,這就是行游程編碼。目前在圖像壓縮編碼中,行游程編碼并不直接對圖像數據進(jìn)行編碼,主要用于對量化后的DCT系數進(jìn)行編碼。
3.時(shí)間冗余度的壓縮:時(shí)間冗余度表現在電視畫(huà)面中相繼各幀對應象素點(diǎn)的值往往相近或相同,具有時(shí)間相關(guān)性。不傳送象素點(diǎn)本身的值而傳送其與前一幀對應象素點(diǎn)的差值,也能有效地壓縮碼率,這就是差分編碼DPCM。在實(shí)際的壓縮編碼中,DPCM主要用于各圖像子塊在DCT變換后的直流系數的傳送。相對于交流系數而言,DCT直流系數的值很大,而相繼各幀對應子塊的DCT直流系數的值一般比較接近,在圖像未發(fā)生跳變的情況下,其差值同直流系數本身的值相比是很小的。
由差分編碼進(jìn)一步發(fā)展起來(lái)的預測編碼,是根據一定的規則先預測出下一個(gè)象素點(diǎn)或圖像子塊的值,然后將此預測值與實(shí)際值的差值傳送給接收端。目前圖像壓縮中的預測編碼主要用于幀間壓縮編碼,方法是先根據一個(gè)子塊的運動(dòng)矢量求出下一幀對應子塊的預測值及其與實(shí)際值的差值,接收端根據運動(dòng)矢量及差值恢復出原圖像。由于運動(dòng)矢量及差值的數據量低于原圖像的數據量,因而也能達到圖像數據壓縮的目的。
4.視覺(jué)冗余度的壓縮:人眼對于圖像的視覺(jué)特性包括:對亮度信號比對色度信號敏感,對低頻信號比對高頻信號敏感,對靜止圖像比對運動(dòng)圖像敏感,以及對圖像水平線(xiàn)條和垂直線(xiàn)條比對斜線(xiàn)敏感等。因此,包含在色度信號,圖像高頻信號和運動(dòng)圖像中的一些數據并不能對增加圖像相對于人眼的清晰度作出貢獻。
壓縮視覺(jué)冗余度的核心思想是去掉那些相對人眼而言是看不到的或可有可無(wú)的圖像數據。對視覺(jué)冗余度的壓縮通常已反映在各種具體的壓縮編碼過(guò)程中。如對于DCT系數的直流與低頻部分采取細量化,而對高頻部分采取粗量化,使得DCT變換能借此壓縮碼率,并能有效地進(jìn)行行游程編碼。在幀間預測編碼中,大碼率壓縮的預測幀及雙向預測幀的采用,也是利用了人眼對運動(dòng)圖像細節不敏感的特性。
圖像壓縮編碼的具體方法雖然還有多種,但大都是建立在上述基本思想之上的。DCT變換,行游程編碼,DPCM,幀間預測編碼及霍夫曼編碼等編碼方法。
三、圖像壓縮的主要技術(shù)與標準
目前有關(guān)圖像壓縮方面的主要標準包括CCITT的H.261,JPEG和MPEG。是分別針對電視電話(huà)圖像,靜止圖像和活動(dòng)圖像的壓縮編碼標準。這幾種壓縮標準雖然各自針對性不同,但壓縮編碼方法大體相似。
1 H.261
H.261又稱(chēng)為P*64,其中P為64kb/s的取值范圍,是1到30的可變參數,它最初是針對在ISDN上實(shí)現電信會(huì )議應用特別是面對面的可視電話(huà)和視頻會(huì )議而設計的。實(shí)際的編碼算法類(lèi)似于MPEG算法,但不能與后者兼容。H.261在實(shí)時(shí)編碼時(shí)比MPEG所占用的CPU運算量少得多,此算法為了優(yōu)化帶寬占用量,引進(jìn)了在圖像質(zhì)量與運動(dòng)幅度之間的平衡折中機制,也就是說(shuō),劇烈運動(dòng)的圖像比相對靜止的圖像質(zhì)量要差。因此這種方法是屬于恒定碼流可變質(zhì)量編碼而非恒定質(zhì)量可變碼流編碼。
圖像壓縮編碼標準的提出最早源于通訊中對可視電話(huà)的研究。經(jīng)過(guò)多年努力,至1980年,國際電報電話(huà)咨詢(xún)委員會(huì )CCITT所屬的視頻編碼專(zhuān)家組的H.261建議被通過(guò),成為可視電話(huà)和電話(huà)會(huì )議的國際標準。H.261又稱(chēng)Px64,傳輸碼率為Px64kbps,其中P=1-30可變,根據圖像傳輸清晰度的不同,碼率變化范圍在64kbps至1.92Mbps之間,編碼方法包括DCT變換,可控步長(cháng)線(xiàn)性量化,變長(cháng)編碼及預測編碼等。其簡(jiǎn)化的編碼原理框圖如圖2所示。
圖中,DCT變換的輸入輸出選擇開(kāi)關(guān)由幀內/幀間模式選擇電路控制。在幀內模式時(shí),開(kāi)關(guān)打到上面,輸入信號經(jīng)DCT變換,線(xiàn)性量化和變長(cháng)編碼后輸出,圖像只進(jìn)行幀內壓縮。在幀間模式時(shí),開(kāi)關(guān)打到下面,前一幀圖像信號經(jīng)過(guò)預測環(huán)中的運動(dòng)補償后產(chǎn)生一個(gè)后幀的預測信號。后幀的實(shí)際輸入信號與其預測值相減后,在進(jìn)行一個(gè)幀內壓縮編碼的過(guò)程后輸出。
圖中變長(cháng)編碼器產(chǎn)生的控制信號送量化器以控制其量化步長(cháng)。當變長(cháng)編碼器的輸入中連續出現許多大數值的數據,導致集中出現長(cháng)的碼組,使緩存器接近溢出時(shí),控制信號使量化器的量化步長(cháng)加大,以降低大數值數據的出現;反之,也可控制量化器以減小其量化步長(cháng)。在預測環(huán)路中由于存在用于恢復前幀信號的反量化器,量化步長(cháng)控制信號也要送到預測環(huán)中的反量化器中。
H.261所針對的可視電話(huà)信號最初考慮是在一般電話(huà)網(wǎng)中傳輸的,帶寬和碼率是其考慮的核心問(wèn)題。其每幀取樣點(diǎn)數比ITU-R601所規定的低許多,且采取抽幀傳輸的方法,無(wú)法滿(mǎn)足數字電視壓縮編碼的要求,但H.261是此前壓縮編碼數十年研究的結果。
2 JPEG
JPEG 是Joint Photographic Experts Group(聯(lián)合圖像專(zhuān)家小組))的縮寫(xiě)。JPEG的壓縮方式通常是破壞性資料壓縮(lossy compressiON),意即在壓縮過(guò)程中圖像的品質(zhì)會(huì )遭受到可見(jiàn)的破壞,有一種以JPEG為基礎的標準Progressive JPEG是采用無(wú)失真的壓縮方式,但Progressive JPEG并沒(méi)有受到廣泛的支援。
JPEG是一種不含幀間壓縮的幀內壓縮編碼方法,其主要編碼過(guò)程與H.261的幀內編碼過(guò)程大致相同。輸入信號經(jīng)DCT變換后,按固定的亮度與色度量化矩陣進(jìn)行非線(xiàn)性量化。對量化后的DCT直流系數進(jìn)行差分編碼,交流系數進(jìn)行行游程編碼,再按霍夫曼碼表進(jìn)行變長(cháng)編碼后,送緩存器輸出。
JPEG不含幀間壓縮,壓縮比較幀內/幀間壓縮低。但因為不含幀間壓縮,使得各幀在壓縮編碼后是各自獨立的,這一點(diǎn)對于編輯來(lái)說(shuō)是有利的,可以做到精確到逐幀的編輯。所以對于活動(dòng)畫(huà)面只進(jìn)行幀內壓縮的Motion-JPEG,目前仍然在一些數字電視編錄設備,如非線(xiàn)性編輯系統中得到應用。
3 MPEG
MPEG-1是MPEG組織制定的第一個(gè)視頻和音頻有損壓縮標準。視頻壓縮算法于1990年定義完成。1992年底,MPEG-1正式被批準成為國際標準。MPEG-1是為CD光碟介質(zhì)定制的的視頻和音頻壓縮格式。一張70分鐘的CD光碟傳輸速率大約在1.4Mbps。而MPEG-1采用了塊方式的運動(dòng)補償、離散馀弦變換(DCT)、量化等技術(shù),并為1.2Mbps傳輸速率進(jìn)行了優(yōu)化。MPEG-1隨后被Video CD采用作為核心技術(shù)。
MPEG-1主要是針對運動(dòng)圖像和聲音在數字存儲時(shí)的壓縮編碼,典型應用如VCD等家用數字音像產(chǎn)品,其編碼最高碼率為1.5Mbps。MPEG-2則針對數字電視的視音頻壓縮編碼,對數字電視各種等級的壓縮編碼方案及圖像編碼中劃分的層次作了詳細的規定,其編碼碼率可從3Mbps到100Mbps。
MPEG的基本編碼過(guò)程與H.261相似,即通過(guò)DCT進(jìn)行幀間壓縮。除了在編碼語(yǔ)法上加進(jìn)了一些特別規定外,與H.261的一個(gè)重要不同是MPEG在預測編碼中加進(jìn)了一個(gè)雙向預測幀B幀,如圖3所示。
圖中,I幀只進(jìn)行幀內壓縮,是作為預測基準的獨立幀,具有較小的壓縮比。由I幀前向預測產(chǎn)生的P幀具有中等壓縮比,并與I幀一起成為B幀的預測基準。由此產(chǎn)生的B幀則具有最高的壓縮比。I幀出現的頻率及I,B,P幀之間如何組合,MPEG未作具體規定,可由編碼器自行選擇。如索尼的數字Betacom錄像機,在壓縮編碼過(guò)程中抽掉了B幀,只有I幀與P幀的組合。
在上述各種圖像壓縮編碼標準中,MPEG-2是專(zhuān)門(mén)針對數字電視的。MPEG-2的壓縮編碼及其標準碼流的形成構成了數字電視信源編碼的核心。
四、MPEG-2標準碼流的形成
符合MPEG-2格式的碼流成為數字電視信源編碼的標準輸出碼流。數字電視信道編碼,DVB及MPEG-2解碼器等均認同和適應此標準。為了形成統一標準的MPEG-2輸出碼流,MPEG-2對其壓縮編碼的適用范圍和編碼語(yǔ)法。
1.MPEG-2的類(lèi)和級
在對數字電視信號進(jìn)行壓縮編碼時(shí),MPEG-2可采用多種編碼工具并實(shí)現不同層次的清晰度。
圖像清晰度由LOW到HIGH逐級提高,使用的編碼工具從SIMPLE到HIGH依次遞增。20個(gè)可能的組合中有11個(gè)已獲通過(guò),稱(chēng)為MPEG-2 適用點(diǎn),其中主類(lèi)主級MP@ML適用于標準數字電視,主類(lèi)高級MP@HL則用于高清晰度電視。
2.MPEG-2的層
MPEG-2根據圖像塊和圖像幀的不同組合劃分為六層。MPEG-2的層直接決定了編碼碼流的形成和結構。MPEG-2的層從下至上依次為:
象塊層:由8x8個(gè)象素點(diǎn)構成的DCT變換基本單元;
宏塊層:在4:2:2取樣中,一個(gè)宏塊由4個(gè)亮度象塊,2個(gè)Cr象塊和2個(gè)Cb 象塊構成。另外還有4:2:0取樣和4:4:4取樣的兩種宏塊;
像條層:一連串宏塊可構成一個(gè)像條;
圖像層:一系列像條可以構成一幅圖像,圖像分為I,B,P三類(lèi);
圖像組層:由相互間相關(guān)的一組I,B,P幀組成,I幀為第一幀;
視頻序列層:一系列圖像組構成了一個(gè)視頻序列;
從象塊開(kāi)始從下至上依次編碼,并在除象塊和宏塊外的每一層的開(kāi)始處加上起始碼和頭標志,就形成了MPEG-2基本碼流。
3.MPEG-2基本碼流的打包與復用
分別從MPEG-2編碼器中輸出的視頻,音頻和數據基本碼流無(wú)法直接送信道傳輸,需要經(jīng)過(guò)打包和復用,形成適合傳輸的單一的MPEG-2傳輸碼流。
MPEG-2所能提供的傳輸率在3-10Mbits/sec間,其在NTSC制式下的分辨率可達720X486,MPEG-2也可提供并能夠提供廣播級的視像和CD級的音質(zhì)。MPEG-2的音頻編碼可提供左右中及兩個(gè)環(huán)繞聲道,以及一個(gè)加重低音聲道,和多達7個(gè)伴音聲道(DVD可有8種語(yǔ)言配音的原因)。由于MPEG-2在設計時(shí)的巧妙處理,使得大多數MPEG-2解碼器也可播放MPEG-1格式的數據
視頻,音頻及數據基本碼流ES先被打成一系列不等長(cháng)的PES小包,稱(chēng)為打包的基本碼流。每個(gè)PES小包帶有一個(gè)包頭,內含小包的種類(lèi),長(cháng)度及其他相關(guān)信息。視頻,音頻及數據的PES小包,按照共同的時(shí)間基準,多路節目碼流經(jīng)傳輸復用后形成由定長(cháng)傳輸小包組成的單一的傳輸碼流,成為MPEG-2信源編碼的最終輸出信號
在數字化電視信號的信源編碼中,根據對圖像清晰度的不同要求及其他方面的考慮,可分別采用JPEG、MPEG-1和MPEG-2作為編碼方法。其中,MPEG-2由于專(zhuān)門(mén)針對數字電視的信源編碼制定了一系列的語(yǔ)法和規范并被廣泛認可,已成為數字電視廣播信源編碼的核心技術(shù)與標準。
矢量控制相關(guān)文章:矢量控制原理
評論