<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > H.264視頻解碼器在C6416 DSP上的實(shí)現

H.264視頻解碼器在C6416 DSP上的實(shí)現

作者：時(shí)間：2008-08-13 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

多媒體通信終端設備具有廣泛的應用前景，可以應用于視頻會(huì )議、可視電話(huà)、PDA、數字電視等各個(gè)領(lǐng)域，所以高效、實(shí)用的多媒體終端設備一直是通信領(lǐng)域研究的主要方向之一。
多媒體通信終端的實(shí)現主要有兩點(diǎn)：一方面需要快速、穩定的處理器作為多媒體信號處理的平臺，另一方面需要適合多媒體通信的協(xié)議標準和軟件算法，尤其是對音視頻信號的壓縮處理算法。兩者的結合才能產(chǎn)生高效的多媒體通信設備。目前，隨著(zhù)數字信號處理器（DSP）的高速發(fā)展，為實(shí)現高效的音視頻信號處理提供了可能性；另一方面，最新的低碼率視頻壓縮標準H.264的出臺，提供了適合通信的視頻標準和算法指導。因此，將兩者結合，把H.264算法在DSP上實(shí)現，對于多媒體通信的研究具有一定的意義和價(jià)值。
本文介紹了H.264解碼器算法的DSP實(shí)現。在設計中，采用了ATEME公司的網(wǎng)絡(luò )視頻開(kāi)發(fā)平臺（NVDK C6416）作為DSP處理平臺，實(shí)現了H.264的優(yōu)化解碼算法。對于QCIF視頻序列，解碼速度達50～60幀/秒。
1 網(wǎng)絡(luò )視頻開(kāi)發(fā)平臺NVDK簡(jiǎn)介
NVDK是TI的第三方ATEME公司推出的基于TI C6400系列DSP評估開(kāi)發(fā)套件，是一款適用于圖像、視頻信號處理的高速DSP開(kāi)發(fā)平臺^[1]。該套件為諸如視頻基礎設施及網(wǎng)絡(luò )化視頻設備等高級視頻應用制造商提供了方便，提高了數字視頻應用項目的開(kāi)發(fā)速度。
1．1 NVDK C6416體系結構
NVDK C6416由TMS320C6416 DSP內核、10/100 Mbps 的以太網(wǎng)子卡、音頻／視頻接口盒、PCI總線(xiàn)、存儲器單元、擴展接口及獨立電源等構成。其功能結構框圖如圖1所示。

1．2 NVDK C6416的主要特點(diǎn)
NVDK作為網(wǎng)絡(luò )及視頻開(kāi)發(fā)套件，把很多音視頻接口及網(wǎng)絡(luò )接口直接做在板卡上，給采用TI C6000系列DSP芯片作為處理單元的開(kāi)發(fā)用戶(hù)提供了便利的前端平臺。它為項目演示、算法實(shí)現、原型制作、數據仿真、FPGA開(kāi)發(fā)和軟件優(yōu)化提供了完整的DSP開(kāi)發(fā)平臺。其主要特點(diǎn)如下：
C6416 DSP內核：600MHz時(shí)鐘頻率及8指令并行結構，最高可以達到4800MIPS的處理能力。
視頻特點(diǎn)：在輸入端，NVDK能夠捕獲PAL制或NTSC制的模擬視頻信號，可以采用復合視頻(CVBS)或者S-video視頻信號輸入，輸入模擬視頻信號被數字化為YUV422數字視頻格式。在輸出端，NVDK在支持復合視頻(CVBS)以及S-Video輸出的同時(shí)，還提供了SVGA輸出模式，可以直接將信號輸出到顯示器上。就圖像尺寸而言，視頻采集提供FULL、CIF和QCIF三種圖像格式，視頻輸出提供FULL和CIF兩種圖像格式。
音頻特點(diǎn)：提供兩路雙聲道音頻輸出，CD音質(zhì)的輸入輸出立體聲接口，另外還提供一路單聲道的麥克風(fēng)輸入。
主接口：提供了PCI接口，允許與PC機相連。該板既可以以PCI模式運行，也可以單獨脫機工作。
網(wǎng)絡(luò )接口：以太網(wǎng)接口為視頻碼流的網(wǎng)絡(luò )傳輸帶來(lái)了方便。
外部擴展存儲器：256M 64位寬擴展內存SDRAMA和8M 32位寬擴展內存SDRAMB及4MB FLASH ROM提供了足夠的內存空間和靈活的內存分配方案。
2 H.264視頻壓縮標準
H.264是由ITU-T 視頻編碼專(zhuān)家組（VCEG）和ISO/IEC移動(dòng)圖像專(zhuān)家組（MPEG）共同提出的最新國際視頻編碼標準。它在H.261、H.263視頻壓縮標準的基礎上，進(jìn)行了進(jìn)一步的改進(jìn)和擴展。其目的是為了進(jìn)一步降低編碼碼率，提高壓縮效率，同時(shí)提供一個(gè)友好的網(wǎng)絡(luò )接口，使得視頻碼流更適合在網(wǎng)絡(luò )上傳送^[2]。由于該標準可以提供更低的碼率，所以更適合應用于多媒體通信領(lǐng)域。
H.264主要有以下新特點(diǎn)：
網(wǎng)絡(luò )適配層NAL（Network Abstraction Layer）。
傳統的視頻編碼編完的視頻碼流在任何應用領(lǐng)域下（無(wú)論用于存儲、傳輸等）都是統一的碼流模式，視頻碼流僅有視頻編碼層（Video Coding Layer）。而H.264根據不同應用增加不同的NAL片頭，以適應不同的網(wǎng)絡(luò )應用環(huán)境，減少碼流的傳輸差錯。
幀內預測編碼模式（Intra Prediction Coding）。
幀內預測編碼合理地利用了I幀的空間冗余度，從而大大降低了I幀的編碼碼流。
自適應塊大小編碼模式（Adaptive Block Size Coding）。
H.264允許使用1616、168、816、88、84、48、44等子塊預測和編碼模式，采用更小的塊和自適應編碼的方式，使得預測殘差的數據量減少，進(jìn)一步降低了碼率。
高精度亞像素運動(dòng)估計（High precision sub-pel Motion Estimation）。
H.264中明確提出了運動(dòng)估計采用亞像素運動(dòng)估計的方法，并制定1/4像素和1/8像素可選的運動(dòng)估計方法。亞像素運動(dòng)估計，提高了預測精度，同時(shí)降低了殘差的編碼碼率。
多幀運動(dòng)補償技術(shù)（Multi-frame Motion Compensation）。
傳統的視頻壓縮編碼采用一個(gè)（P幀）或兩個(gè)（B幀）解碼幀作為當前幀預測的參考幀。在H.264中，最多允許5個(gè)參考幀，通過(guò)在更多的參考幀里進(jìn)行運動(dòng)估計和補償，找到殘差更小的預測塊，降低編碼碼率。
整形變換編碼（Inter Transform Coding）。
H.264采用整形變換代替DCT變換，整形變換采用定點(diǎn)運算代替浮點(diǎn)運算。采用這種變換，不僅可以降低編解碼的時(shí)間，而且，為該算法在多媒體處理平臺上實(shí)現帶來(lái)了方便。在這一點(diǎn)上，H.264視頻編碼標準更適合作為多媒體終端的編解碼標準。
兩種可選擇熵編碼CAVLC和CABAC。
CAVLC（Context-based Adaptive Variable Length Coding）：基于內容的自適應變長(cháng)編碼。
CABAC（Context-based Adaptive Binary Arithmetic Coding）：自適應二進(jìn)制算術(shù)編碼。
以往的視頻壓縮標準中，都采用Huffman編碼與變長(cháng)編碼相結合的方法進(jìn)行熵編碼。Huffman編碼雖然是一種很好用的熵編碼方法，但是其編碼效率并不是最高的，而且，Huffman編碼的抗差錯性能很低。H.264中采用了兩種可以選擇的熵編碼方法：CAVLC編碼抗差錯能力比較高，但是編碼效率不是很高；CABAC編碼是一種高效率的熵編碼方法，但是計算復雜度很高。兩者各有優(yōu)缺點(diǎn)，所以針對不同的應用，選擇不同的編碼方法。

3 H.264解碼器算法的DSP實(shí)現和優(yōu)化
3.1 在PC機上實(shí)現H.264算法并進(jìn)行優(yōu)化
ITU-T官方提供的H.264的核心算法不僅在代碼結構上需要改進(jìn)，而且在具體的核心算法上也需要做大的改動(dòng)，才能達到實(shí)時(shí)的要求。這一步需要做的具體工作包括：去處冗余代碼、規范程序結構、全局和局部變量的調整和重新定義、結構體的調整等。
3.2 PC機H.264代碼的DSP化
C6000開(kāi)發(fā)工具Code Composer Studio有自己的ANSI C編譯器和優(yōu)化器，并有自己的語(yǔ)法規則和定義，所以在DSP上實(shí)現H.264的算法要把PC機上C語(yǔ)言編寫(xiě)的H.264代碼進(jìn)行改動(dòng)，使其完全符合DSP中C的規則。
這些改動(dòng)包括：去除所有的文件操作；去除可視化界面的操作；合理安排內存空間的預留和分配；規范數據類(lèi)型――因為C6416是定點(diǎn)DSP芯片，只支持四種數據類(lèi)型：short型（16 bit）、int（32bits）、long型（40bits）和double型（64bits），因此必須對數據進(jìn)行重新規范，把浮點(diǎn)數的運算部分近似用定點(diǎn)表示，或用定點(diǎn)實(shí)現浮點(diǎn)運算；根據內存的分配定義遠近程常量和變量；把常用的數據在數據結構中提取出來(lái)，以near型數據定義在DSP內部存儲空間，以減少對EMIF端口的讀取，從而提高速度。
3.3 H.264的DSP算法優(yōu)化^[3]
通過(guò)把PC機H.264代碼DSP化，可以在DSP上實(shí)現H.264的編解碼算法，但是，這樣實(shí)現的算法運行效率很低，因為所有的代碼都是由C語(yǔ)言編寫(xiě)，并沒(méi)有完全利用DSP的各種性能。所以必須結合DSP本身的特點(diǎn)，對其進(jìn)一步優(yōu)化，才能實(shí)現H.264視頻解碼器算法對視頻圖像的實(shí)時(shí)處理。
對DSP代碼的優(yōu)化共分為三個(gè)層次：項目級優(yōu)化、C程序級優(yōu)化、匯編程序級優(yōu)化。
(1)項目級優(yōu)化：主要是通過(guò)選擇CCS提供的編譯優(yōu)化參數，根據H.264系統的要求進(jìn)行優(yōu)化，通過(guò)不斷地對各個(gè)參數（ -mw -pm -o3 -mt等）的選擇、搭配、調整，改善循環(huán)、多重循環(huán)體的性能，進(jìn)行軟件流水，從而提高軟件的并行性。
(2)C程序級優(yōu)化：主要是針對采用的DSP的具體特點(diǎn)進(jìn)行代碼的功能精簡(jiǎn)、數據結構的優(yōu)化、循環(huán)的優(yōu)化、代碼的并行化處理。在這里主要工作包括以下部分：去除掉SNR計算、幀率及其他輔助信息的程序模塊。函數及數據映射區域的調整，把經(jīng)常用的數據存儲在片內存儲器中，頻繁調用的程序盡可能映射在相鄰或相近的存儲區域。C函數的并行化處理，針對并行化效果差的函數，尤其是多重循環(huán)體，要進(jìn)行循環(huán)拆解，將多重循環(huán)拆解為單重循環(huán)。減少存儲區數據的讀取和存儲，尤其是片外存儲區域數據的調用，以減少時(shí)間。數據結構的重定義和調整。
下面以數據結構的調整說(shuō)明如何合理利用DSP特性進(jìn)行軟件優(yōu)化。
數據結構是指數據的類(lèi)型及其在內存空間的分配方式，不同的數據結構，對程序的性能有不同的影響。因此，數據結構的調整對程序在DSP上并行執行是必不可少的步驟。
在H.264解碼器內核代碼中，數組mpr[i][j]用來(lái)存放一個(gè)宏塊的預測系數，數據類(lèi)型是int型，其中i、j是該系數的坐標。但是預測系數實(shí)際上只有8位位寬，所以，定義成byte型就足夠了。這樣一方面節省了內存空間，另一方面，用byte類(lèi)型可以直接使用LDW指令代替LDB指令，一次讀取4個(gè)數據，節省了讀取時(shí)間。因為H.264中對系數的讀取都是以塊為單位的，而內核中的mpr數據結構顯然不能充分利用DSP的特性，所以數據存儲結構也需要調整，把mpr中每一個(gè)塊分配到一個(gè)連續的內存空間有利于數據的傳送，如圖2所示。這樣，每一次確定了一個(gè)塊以后，只要更改一維的信息就能確定系數的位置，而原始的結構對每一個(gè)系數都有確定兩位系數。通過(guò)這樣的數據調整，可以明顯地提高程序的運行速度。

(3)匯編程序級優(yōu)化。匯編級的優(yōu)化包括兩部分：采用線(xiàn)性匯編語(yǔ)言進(jìn)行優(yōu)化和直接用匯編語(yǔ)言進(jìn)行優(yōu)化。由于系統編譯器的局限性，并不能將全部的函數都很好地優(yōu)化，這樣就需要統計比較耗時(shí)的C語(yǔ)言函數，用匯編語(yǔ)言重新編寫(xiě)。這些函數包括：插值函數、幀內預測函數、整形反變換等函數。
下面以差值函數中的一段來(lái)說(shuō)明匯編編寫(xiě)帶來(lái)的性能提高。
橫向1/2插值源代碼：
for (j = 0; j BLOCK_SIZE; j++) {
for (i = 0; i BLOCK_SIZE; i++) {
for (result = 0, x = -2; x 4; x++)
result += mref[ref_frame][ y_pos+j][ x_pos+i+x]*COEF[x+2];
block[i][j] = max(0, min(255, (result+16)/32));
}
}
該段代碼采用一個(gè)六階濾波器來(lái)插值1/2位置的像素值，共插出16個(gè)值（一個(gè)塊）。源代碼采用三重循環(huán)，內層循環(huán)是插值濾波器，如果直接用編譯器把源代碼編譯成匯編的話(huà)，內部循環(huán)都要反復讀取一些內存數據。采用匯編自己編寫(xiě)，則可以改進(jìn)算法，大大降低函數的運行時(shí)間。
如圖3所示，在插值第一個(gè)半像素位置時(shí)，要在內存中讀取1～6像素的值，插值第二個(gè)半像素位置時(shí)，要讀取2～7點(diǎn)的值，這樣，就反復讀取了2～5像素點(diǎn)的值，而且，插值一個(gè)點(diǎn)需要進(jìn)行6次乘法、5次加法。用匯編語(yǔ)言編寫(xiě)，手工排流水線(xiàn)，可以降低數據的讀取次數，同時(shí)減少了乘、加法指令數。首先，采用LDNW指令直接讀取8個(gè)數據到寄存器中，每次插值直接使用寄存器而不再去內存中讀取數據。另外，采用DOTPSU4乘累加命令代替MPL指令，將四次乘法和3次加法用一條指令來(lái)代替，減少了指令數目。

通過(guò)以上各種優(yōu)化方法，最終實(shí)現了基于C6416內核的H.264 baseline解碼器算法。
4 算法性能的評測及前景展望
在NVDK C6416環(huán)境下，測試了解碼器算法，對QCIF測試序列，已經(jīng)能夠達到50～60幀/秒的解碼速度，遠遠達到了實(shí)時(shí)性解碼的目的。
在NVDK C6416板卡上實(shí)現的H.264視頻解碼器具有功能強、使用靈活等特點(diǎn)，有廣泛的應用前景。該優(yōu)化的算法不僅適用于NVDK板，對于所有的C64開(kāi)發(fā)板都具有通用性，只要根據板卡的內存分配，重新配置內存參數文件，便可以把該算法移植到新的開(kāi)發(fā)板中。該H.264視頻解碼器與網(wǎng)絡(luò )平臺相連接便可以應用于視頻會(huì )議、可視電話(huà)、無(wú)線(xiàn)流媒體通信等應用領(lǐng)域。
參考文獻
1 IEKC64X USERS MANUAL. Data Sheet.
2 Thomas Wiegand, Gary J.Sullivan, Gisle Bjontegaard andAjay Luthra.Overview of the H.264/AVC Video Coding Standard. IEEE Transactions on Circuits and Systems for VideoTechnology, 2003；（7）：560～576
3 SPRU187g. TMS320 C6000 Optimizing C Compiler User'sGuide. March 2000

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： DSP 實(shí)現 C6416 解碼器 視頻 H.264

評論

相關(guān)推薦

DSP芯片的原理與開(kāi)發(fā)應用

資源下載 TI DSP 開(kāi)發(fā)原理 | 2007-12-15

vxworks下bsp制作教程(老站轉)

amine | 2002-05-28

進(jìn)芯電子攜多款DSP芯片及消費電子解決方案亮相2024中國制冷展

工控自動(dòng)化進(jìn)芯電子 DSP 中國制冷展 | 2024-04-10

TI DSP開(kāi)發(fā)工具CCS上AET調試功能

視頻 TI DSP DSP AET CCS | 2009-10-16

仿真器概念及實(shí)現技術(shù)

jackwang | 2002-05-14

華為最強科普：什么是DSP？

嵌入式系統 DSP | 2024-05-20

IGBT實(shí)現慢降柵壓的電路

設計方案實(shí)現慢降柵壓 | 2009-07-06

“進(jìn)芯電子”為DSP電機控制帶來(lái)國風(fēng)新勢力

工控自動(dòng)化 202405 進(jìn)芯 DSP 電機控制 | 2024-04-17

24 核英特爾 Arrow Lake-H 酷睿 Ultra 200 系列處理器實(shí)拍圖曝光

消費電子 Arrow Lake-H 英特爾酷睿 | 2024-03-21

恩智浦SAF9xxx發(fā)布，汽車(chē)AI音頻處理升級！

汽車(chē)電子汽車(chē)音頻 DSP SDV 汽車(chē)娛樂(lè )系統 | 2024-06-21

2023年慕尼黑華南電子展：EEPW&北京中科昊芯科技有限公司

嵌入式系統中科昊芯數字信號處理器 RISC-V DSP | 2023-11-02

DSP 入門(mén)教程

資源下載 TI DSP 選型技術(shù)介紹 | 2007-12-14

充電器算法復雜傳統MCU難以勝任？不如試試這些集成DSP內核的MCU

嵌入式系統 DSP MCU | 2024-05-15

H-Converter

資源下載命令行的轉換工具軟件 H-Converter | 2007-11-29

HVT H-1410型彩色顯示器的電源電路圖

設計方案 H-1410 彩色顯示器電源電路圖 | 2009-07-06

專(zhuān)為客戶(hù)設計的高性能器件系列

視頻 TI DSP TMS320C6474 C6474 AIF | 2009-10-16

通信接收機：DSP、軟件無(wú)線(xiàn)電和設計

資源下載 DSP 軟件無(wú)線(xiàn)電通信接收機 | 2007-12-11

本土廠(chǎng)商難舍DSP情懷

嵌入式系統 DSP 嵌入式微處理器數字信號處理 | 2024-01-16

C64+ 系列DSP上Cache 的應用（第一部分）

視頻 TI DSP C64+ Cache | 2009-10-16

高性能系列DSP上TCP2/VCP2協(xié)處理器

視頻 TI DSP VCP2 TCP2 協(xié)處理器 | 2009-10-16

TMS320LF240x DSP應用程序設計教程

資源下載 TI TMS320LF240x DSP 應用程序設計 | 2007-12-08

如何在A(yíng)DI DSP中設計一個(gè)合理的混響？

模擬技術(shù) ADI DSP 混響 | 2024-01-30

[轉帖]請問(wèn)vxworks下如何實(shí)現漢字的顯示和輸入

amine | 2002-05-28

由MAX4188構成的視頻線(xiàn)驅動(dòng)放大器電路

設計方案 MAX4188 構成視頻驅動(dòng) 放大器 | 2009-07-06

用C語(yǔ)言進(jìn)行面向對象編程(老站轉)

amine | 2002-05-28

C64+ 系列DSP上Cache 的應用（第二部分）

視頻 TI DSP C64+ Cache | 2009-10-16

Cadence擴充Tensilica Vision產(chǎn)品線(xiàn)，新增毫米波雷達加速器及針對汽車(chē)應用優(yōu)化的新款DSP

EDA/PCB Cadence Tensilica Vision 毫米波雷達加速器 DSP | 2024-03-05

模擬電路PWM的實(shí)現

設計方案模擬電路實(shí)現 | 2009-07-06

利用PIC12C508單片機來(lái)實(shí)現加密狗技術(shù)[轉帖]

hpnet | 2002-05-19

高速3:1視頻多路分配器(MAX4188)

設計方案高速視頻多路分配器 MAX4188 | 2009-07-06

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>