Imagination Rogue GPU技術(shù)優(yōu)勢分析
2013年全球微處理器銷(xiāo)售額將以史上最快的增長(cháng)速度突破610億美元,這主要歸功于連接到互聯(lián)網(wǎng)的手機和平板電腦的強勁需求。據調研機構Gartner的預測,2015年全球200~300美元中價(jià)位智能移動(dòng)設備(智能手機/平板電腦)出貨量將達5.8億臺,并且用戶(hù)主要使用的功能是影音編輯和分享。
本文引用地址:http://dyxdggzs.com/article/201610/307390.htm得益于浮點(diǎn)運算優(yōu)勢,GPU可以有效地接替來(lái)自CPU在圖形渲染過(guò)程中產(chǎn)生的幾乎所有計算負荷,并且速度十分驚人。因此,當系統檢測需要更復雜的計算時(shí),運算會(huì )從CPU切換到GPU工作模式,在一些測試環(huán)境下,渲染性能可以輕易地從十幾幀每秒加速到上百幀每秒。在GPU技術(shù)的支持下,芯片供應商和設備制造商可提供諸如3D UI、實(shí)時(shí)視頻圖像處理、具有逼真圖像體驗的游戲應用和增強實(shí)境等豐富的應用模式。
所以,今后整個(gè)行業(yè)對GPU的重視會(huì )大大超過(guò)CPU本身,因為今后主流消費者使用移動(dòng)設備主要的用處是多媒體娛樂(lè ),視頻和游戲的處理都更加依賴(lài)GPU的計算能力。GPU在移動(dòng)處理器中的重要程度已經(jīng)日益凸顯,高通移動(dòng)處理器的一大賣(mài)點(diǎn)就是自己的Adreno GPU。
當然在移動(dòng)GPU市場(chǎng)的老大是Imagination,根據市場(chǎng)研究公司Jon Peddie Research的報告,Imagination以37.6%的市場(chǎng)份額,依然穩坐2013年移動(dòng)GPU領(lǐng)先供應商頭把交椅。但它的最大競爭對手ARM在GPU的市場(chǎng)份額也達到了18.4%,由于A(yíng)dreno GPU的市場(chǎng)份額全部來(lái)自自家的處理器,不會(huì )對外授權,所以今后的GPU市場(chǎng)競爭主要是Imagination和ARM之間的戰爭。這兩家IP巨頭除了在CPU領(lǐng)域展開(kāi)競爭以外,在GPU領(lǐng)域的戰火也燒到了下一代GPU內核。
PowerVR 6系列GPU與競爭對手Mali-T600系列GPU的規格對比
PowerVR 6系列Rogue GPU 公布于2011 年第三季度。CES 2012 上,PowerVR Rogue GPU 首批兩款產(chǎn)品,PowerVR G6200 和 PowerVR G6400 亮相。2013 年 Imagination 又公布了 PowerVR Series 6XE 和 PowerVR Series 6XT 兩個(gè)子系列產(chǎn)品。6系列GPU都支持DirectX 10,部分型號可支持最新的DirectX 11.1,還支持OpenGL 3.x/4.x、OpenGL ES 3.0,以及通用計算領(lǐng)域的OpenCL 1.x、Renderscript Compute。根據配置的不同,PowerVR 6系列GPU的浮點(diǎn)性能在100Gflops到最高1Tflops之間,可帶來(lái)最多60倍于5系列的圖形和計算性能提升。
Intel Atom 處理器 Z3480、蘋(píng)果 iPhone 5S 的A7處理器乃至聯(lián)發(fā)科MT8135等都集成了Imagination 最新一代的PowerVR Rogue GPU。
Mali-T600 系列于2012 年露面,開(kāi)發(fā)代號Midgard,是 ARM 的首個(gè)統一渲染架構。Mali-T600全系列支持OpenGL ES 2.0/1.1,OpenCL 1.1,DirectX 11,其中Mali-T622、Mali-T624、Mali-T628、Mali-T678還能夠支持OpenGL ES3.0。露面最早的Mali-T604 是第一代,Mali-T624 / 628 / 678 等后續產(chǎn)品則是第二代。Mali-T624的規格參數基本與T604一致,不過(guò)核心升級到了第二代Midgard,T628最多能支持8核配置。曇花一現的Mali-658還是第一代Midgard架構,現在已經(jīng)被二代Midgard架構的T678取代,之前的資料顯示T658的性能是Mali-400 MP的10倍,計算性能是后者的4倍,Mali-678只會(huì )比這個(gè)指標更強。
以上的對比可以看出,PowerVR 6系列支持的API更加全面,多了OpenGL的支持,雖然在移動(dòng)消費端用處還不大,但在工業(yè)級應用還是有很大優(yōu)勢的。
PowerVR的看家本領(lǐng)——TBDR渲染技術(shù)
首先說(shuō)說(shuō)Imagination最具優(yōu)勢的移動(dòng)渲染技術(shù)TBDR。由于功耗和內存帶寬的限制,移動(dòng)平臺的GPU相對于桌面平臺,會(huì )有一些不同。目前幾乎所有的桌面GPU(nVIDIA,AMD)都是IMR(Immediate Mode Rendering,直接模式渲染)架構,在移動(dòng)領(lǐng)域,nVIDIA的GeForce ULP和Vivante的GC系列GPU都是屬于IMR架構。IMR架構的GPU渲染完物體后,都會(huì )把結果寫(xiě)到系統內存中的幀緩存里,因此就可能出現GPU花了大量的時(shí)間渲染了一個(gè)被遮擋的看不見(jiàn)的物體,而最后這些結果在渲染完遮擋物后被覆蓋,做了無(wú)用功。這個(gè)問(wèn)題稱(chēng)之為Overdraw。另外,由于IMR架構的GPU頻繁的讀寫(xiě)和修改幀緩存,因此對帶寬的要求比較高,同時(shí)也增加了電力的消耗。所以,大部分的移動(dòng)GPU都采用TBR(Tile Based Rendering,分塊渲染)的架構。
ARM的Mali GPU和高通的Adreno GPU采用TBR架構,實(shí)際上Imagination的PowerVR也是分塊渲染的。TBR架構在把三角形場(chǎng)景變成像素圖前,先把整個(gè)畫(huà)面分成小塊,這些小塊的渲染在GPU上的高速緩存里進(jìn)行,這樣就可以避免對幀緩存(位于系統內存里)的頻繁讀寫(xiě)和修改。但是,除去PowerVR外的TBR GPU同IMR一樣,還是不能避免Overdraw的問(wèn)題。而PowerVR的不同之處在于,它采用的TBDR(Tile Based Deferred Rendering,分塊延時(shí)渲染)架構,可以徹底避免Overdraw的問(wèn)題。相比TBR更進(jìn)一步的是,TBDR在光柵化之后,有一個(gè)HSR(Hidden Surface Removal,隱藏曲面消除)硬件單元,通過(guò)對一個(gè)塊內的三角形進(jìn)行測試,剔除掉被遮擋的三角形,合成一幅由所有可見(jiàn)部分組成的畫(huà)面,交給后續的流水線(xiàn)去渲染。這樣不可見(jiàn)部分就不需要著(zhù)色器去做相應的計算,也不需要去拾取相應的紋理,節省了計算量的同時(shí)也節省了帶寬,對移動(dòng)設備來(lái)說(shuō)有很大的幫助。
GPU的競爭也是軟件生態(tài)系統的競爭
移動(dòng)GPU的硬件架構是影響游戲流暢度以及省電的重要因素,但在軟件支持方面,紋理壓縮格式也是影響游戲支持度高低的重要因素,由于移動(dòng)GPU并不像桌面GPU以及游戲都有統一的DirectX標準,造成不同移動(dòng)GPU所支持的紋理壓縮格式技術(shù)互不兼容,也造就了移動(dòng)GPU 多強鼎立的局面。
移動(dòng)GPU主流的紋理壓縮格式分別為ETC、PVRTC、S3TC、ATITC,在3D游戲中豐富的紋理和細節對游戲的質(zhì)量可說(shuō)是相當重要。不過(guò),由于顯示內存和帶寬受限的緣故,所有紋理都必須經(jīng)過(guò)壓縮,否則會(huì )帶給顯示內存和帶寬極大的壓力,而紋理壓縮格式便是用來(lái)解決這項問(wèn)題。在OpenGL ES 2.0版本規范里,將ETC(Ericsson Texture Compression)列為移動(dòng)GPU紋理壓縮格式的固定班底,并且要求各個(gè)移動(dòng)GPU都必須支持此種紋理壓縮格式技術(shù)。
Imagination 的PowerVR Rogue GPU 系列支持的是 PVRTC (PowerVR Texture Compression) 和 ETC,ARM的Mali-T600 系列支持的是ETC 和ASTC。ASTC由ARM 提出,2012 年被 Khronos 組織認可,納入到OpenGL ES 3.0 標準中。不過(guò) ASTC 并非強制性的標準,目前也只有 Mali-T600 系列支持。PowerVR 可以做到將紋理壓縮至最小體積(原圖十分之一不到)但仍保持清晰,比OpenGL ES 官方標準的S3TC 和ETC 要小了一半體積,這也算是PowerVR的技術(shù)優(yōu)勢。
ETC 是最通用的紋理壓縮格式,幾乎所有的安卓設備都可以支持 ETC 壓縮的文件。不過(guò)ETC 并不招廠(chǎng)商待見(jiàn),因為 ETC 紋理壓縮不支持 Alpha 通道,只能用于壓縮不透明的材質(zhì),且只能將單一紋理拆解成2個(gè)間接執行。S3TC是桌面顯卡通用的壓縮格式,看起來(lái)是最完美的選擇,可惜 S3TC 還是一種私有的標準,有專(zhuān)利上的麻煩。
盡管PVRTC 是PowerVR 專(zhuān)有的格式,但PowerVR 已占據最大的移動(dòng)GPU市場(chǎng)份額,開(kāi)發(fā)者做紋理時(shí)勢必會(huì )考慮到這一標準。加之本身這一標準具有高壓縮率的優(yōu)勢,更能推動(dòng)3D游戲技術(shù)的進(jìn)步。ASTC 則太新鮮,現在還鮮有開(kāi)發(fā)者支持這個(gè)標準,市場(chǎng)上Mali GPU的占有率也還不足以幫助這一標準推廣。
總結
ARM的Mali GPU給人的感覺(jué)更像是PC中的公版顯卡一樣,積極支持各種最新標準,注重性能功耗比。但是Mali GPU的問(wèn)題在于目前授權使用的大部分還是Mali-450 MP以下的,Mali-T604除了在三星的Exynos 5250中有過(guò)應用,發(fā)布過(guò)一年多以來(lái)未見(jiàn)其他處理器集成。即便是三星這個(gè)老朋友,新一代的Exynos 5 Octa也改用PowerVR的GPU核心了,感覺(jué)業(yè)界的接受度還是不夠高。
PowerVR Rogue GPU 延續了 Imagination 一貫的技術(shù)優(yōu)勢:TBDR渲染技術(shù)獨步天下,且對各類(lèi) API 的支持領(lǐng)先于業(yè)界。這一代顯卡的性能甚至超越了部分桌面 GPU,能耗卻比桌面 GPU 更低,適合多種嵌入式移動(dòng)設備。相比另一主要競爭者ARM Mali-T600系列,PowerVR Rogue GPU 優(yōu)勢在于紋理壓縮標準已有健壯的生態(tài)系統支持,而Mali 的標準目前還沒(méi)能贏(yíng)得開(kāi)發(fā)者首肯,紙面的技術(shù)優(yōu)勢無(wú)法體現出來(lái)。GPU的性能和軟件的優(yōu)化有極大關(guān)系,這是現在PowerVR系列GPU能夠領(lǐng)先市場(chǎng)的最大優(yōu)勢。
Imagination能成為移動(dòng)GPU的老大顯然會(huì )有很多獨特優(yōu)勢和技術(shù)。它的GPU不是理論性能最強的,不過(guò)單位功耗性能、單位面積性能表現都很強,多核集成、配套的開(kāi)發(fā)工具、PVRTC紋理壓縮格式、TBDR渲染技術(shù)都是它沖鋒陷陣的利器,綜合起來(lái)PowerVR還是表現最優(yōu)秀的移動(dòng)GPU。
評論