<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>
關(guān) 閉

新聞中心

EEPW首頁(yè) > 工控自動(dòng)化 > 設計應用 > 基于龍芯3B的H.264解碼器的向量化

基于龍芯3B的H.264解碼器的向量化

作者: 時(shí)間:2010-12-15 來(lái)源:網(wǎng)絡(luò ) 收藏

摘要:本文實(shí)現了ffmpeg平臺的移植,并針對所支持的擴展指令,對ffmpeg進(jìn)行了化。實(shí)驗結果表明:實(shí)現化的ffmpeg,其性能比使用GCC向量化編譯得到的ffmpeg解碼器具有更好的性能,而且性能提升的比率比在一些商業(yè)平臺上更大。
關(guān)鍵詞:H.264;ffmpeg;解碼器;Godson3B;向量化

0 引言
當今社會(huì )已經(jīng)步入信息時(shí)代,傳統的信息載體和通信方式已經(jīng)無(wú)法滿(mǎn)足人們對信息的需求。而實(shí)驗表明:相比較語(yǔ)音和抽象數據,人類(lèi)接受的信息更多是以圖片和視頻方式為載體的。其中視頻信息具有直觀(guān)、具體和高效的特點(diǎn),這也就決定了視頻通信技術(shù)將成為信息時(shí)代的重要技術(shù)之一。
由于視頻的數據量巨大,而存儲視頻的資源通常是非常有限的,因而對視頻進(jìn)行壓縮編碼,以減少存儲資源的消耗,非常必要。然而,通常情況下,使用的壓縮算法的復雜度越高,壓縮比率越高,視頻播放時(shí)的解碼速度就會(huì )越低。因而在提高編碼壓縮率的同時(shí),也需要對解碼器進(jìn)行相應的優(yōu)化,以提高視頻解碼器在目標平臺上的性能。本文就實(shí)現了ffmpeg解碼器在上的移植與向量化,提高了該解碼器在龍芯3B上的性能。

1 視頻編/解碼與龍芯3B
1.1 視頻編/解碼
目前,成熟的壓縮編/解碼方法有很多。其中H.261、MPEG-1、MPEG-3和H.263采用了第一代壓縮編碼方法,如預測編碼、變換編碼、熵編碼以及運動(dòng)補償;而MPEG-4和H.264采用了第二代的壓縮編碼方法,如分段編碼和基于模型或對象的編碼等。
視頻壓縮編碼的主要目的是減少存儲視頻所占用的資源,而解碼技術(shù)的目標則是提高解碼的速度,從而提高視頻播放的流暢性。常見(jiàn)的基于H.264編碼方法的軟解碼器包括CoreAVC、ffmpeg和JM等。其中JM是H.264官方網(wǎng)站提供的編/解碼器,集合了各種編/解碼算法,而且代碼的結構清晰,很適合應用于對視頻編/解碼技術(shù)的研究。而CoreAVC解碼器則主要用于商用,其解碼速率比f(wàn)fmpeg快50%以上。ffmpeg是開(kāi)源的解碼器,而且性能相對較好,很多開(kāi)源項目都直接或間接地使用了ffmpeg,如mplayer播放器等。通過(guò)對性能以及開(kāi)源特性的綜合考慮,本文選擇ffmlpeg作為移植和向量化對象。
1.2 龍芯3B體系結構
龍芯3B處理器在兼容了MIPS64指令集的同時(shí),實(shí)現了針對多媒體應用的向量擴展指令,這對視頻編/解碼應用性能的提升有很大的幫助。
龍芯3B提供了256位的向量寄存器并實(shí)現包括256位向量訪(fǎng)存在內的向量擴展指令。使用向量指令可以一次完成32個(gè)字節寬度數據的操作。而這樣的結構和指令集設計,使得龍芯3B非常適合于實(shí)現大規模相同類(lèi)型數據的相同運算,比如矩陣乘法運算和FFT運算,以及視頻編
/解碼運算等。
不過(guò)由于ffmpeg并未實(shí)現對龍芯3B平臺的支持,因而需要完成ffmpeg到龍芯3B的移植工作。本文之前也有一些ffmpeg到其他平臺的移植工作和針對龍芯平臺的移植與優(yōu)化工作,都取得了不錯效果。

2 基于龍芯3B的ffmpeg移植
2.1 ffmpeg的移植
ffmpeg解碼器提供了對不同目標平臺的支持,而與這些平臺相關(guān)的文件都保存在以該目標平臺命名的目錄下。例如,ffmpeg解碼器實(shí)現了對arm和sparc平臺,以及x86平臺的支持。
對于實(shí)現ffmpeg解碼器對龍芯3B的支持,主要完成以下5個(gè)步驟:
(1)修改configure配置文件,增加與龍芯體系結構相關(guān)的配置選項;
(2)新建龍芯專(zhuān)用文件夾godson,將龍芯體系結構相關(guān)的文件都存放于該文件夾中;
(3)將godson文件夾下新增的需要編譯的文件添加到Makefile中;
(4)增加與dsputil_init類(lèi)似的新的初始化函數dsputil_init_godson;
(5)在頭文件中添加新增函數的聲明。
針對龍芯3B的ffmpeg移植工作相對比較簡(jiǎn)單,因而本文重點(diǎn)介紹針對龍芯3B的向量化工作。
2.2 移植后的ffmpeg的性能比較
本節對移植后的ffmpeg解碼器進(jìn)行了性能測試,對使用龍芯3B向量擴展指令和不使用龍芯3B擴展指令兩種情況下的性能進(jìn)行了比較。測試時(shí)使用支持龍芯3B擴展指令集的GCC編譯器進(jìn)行編譯,并且開(kāi)啟-ftree-vectorize和-march=godson3b編譯選項來(lái)支持龍芯 3B擴展指令。使
用的測試用例為視頻“walk_vag_640x480_qp26.264”,測試結果如表1所示。
從表1的測試結果中可以看出,使用龍芯3B的向量擴展指令可以提高ffmpeg解碼器在龍芯3B上的性能,用來(lái)測試的視頻的解碼時(shí)間減少了約466s。盡管如此,由于GCC編譯器本身自動(dòng)向量化能力的限制,ffmpeg解碼器的性能提升還是比較有限的,因而針對龍芯3B的指令集對移植后的ffmpeg解碼器進(jìn)行向量化,就成為了進(jìn)一步提高性能的重要工作。

a.JPG


上一頁(yè) 1 2 3 下一頁(yè)

關(guān)鍵詞: 龍芯3B 解碼器 向量

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>