<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > Cortex-A15架構解析:探索強勁性能的秘密

Cortex-A15架構解析:探索強勁性能的秘密

作者: 時(shí)間:2017-10-21 來(lái)源:網(wǎng)絡(luò ) 收藏

  今年的新手機趨勢無(wú)異是全面向四核靠攏,不過(guò)同樣是四核,在實(shí)際的性能上其實(shí)是千差萬(wàn)別。例如針對入門(mén)級主流市場(chǎng)的四核手機普遍采用的都是Cortex-A7以及 Cortex-A9 級別的CPU內核,這類(lèi)內核性能、成本以及發(fā)熱都會(huì )較低,因此在入門(mén)市場(chǎng)上大行其道。

本文引用地址:http://dyxdggzs.com/article/201710/367246.htm

  而在高端智能手機中則出現了一些新的變化,除了去年就已經(jīng)嶄露頭角的高通Krait系列架構四核外,正統的也開(kāi)始走上了四核手機的舞臺,例如三星的Exynos 5 Octa、NVIDIA 的Tegra 4。

   Cortex-A家族中目前最強勁的CPU內核架構,發(fā)布時(shí)間為2010年,德州儀器是最早(2011年)投產(chǎn)基于該架構處理器(型號為OMAP 5)的授權廠(chǎng)商。

  和的Cortex-A7、Cortex-A9等微架構相比,有很大的不同。

  A15和A9同樣具備亂序執行,但是Cortex-A15具備(兩倍)的指令發(fā)射端口和執行資源,指令解碼能力也要高出50%,動(dòng)態(tài)分支預測能力更強(采用了多層級分支表緩存),指令拾取帶寬更強(128 bit vs 64 bit),這些都能讓A15的流水線(xiàn)執行具備更高的效率。除此以外,A15采用了VFPv4浮點(diǎn)單元設計,能執行FMA指令以及硬件除法指令,相較而言A9的峰值向量浮點(diǎn)性能基本上只有A15的一半。

  不過(guò)在現實(shí)中,A15 的對手應該是高通自行設計的 ARMv7A 兼容處理器架構 Krait。高通對 Krait 的架構細節透露并不是很多,大致上就是 3 個(gè)指令解碼端口(和 A15 一樣)、7個(gè)指令發(fā)射端口(A15 是8個(gè))、4個(gè)發(fā)射端口(A15 是8個(gè)),具備4KB+4KB的單周期時(shí)延L0 Cache設計。

  如果采用老掉牙的Dhrystone DMIPS/MHz作為性能衡量指標,Krait 是3.3,A9 是2.5,而A15則是3.5,從紙面上看Krait的確非常適合作為A15的對手。

  不過(guò)Dhrystone的缺點(diǎn)是顯而易見(jiàn),它是完全可以塞進(jìn)CPU的L1 cache里執行,這就意味著(zhù)無(wú)法以此對L2 cache(A15是一體化設計,Krait是分離式設計,一體化設計可以減少內存交換導致的大量時(shí)延)、亂序執行的硬件效率/復雜性、內存子系統單元(A15的內存單元可以實(shí)現在一定條件下預執行一條加載指令,而Krait能否具備這樣的能力尚不清楚)等諸多體系架構區別對實(shí)際性能的影響作出有價(jià)值評估。

  當然,ARM采用的DMIPS指標實(shí)際上并非28年前的那個(gè)Dhrystone,而是來(lái)自EEBMC Coremark(其實(shí) Coremark 就是前者的改善版本,主要是為了減少預優(yōu)化、對測試有比較嚴格的規則),但是CoreMark同樣可以塞進(jìn)現今大多數處理器的L1 cache里,Dhrystone不能反映現今移動(dòng)設備真實(shí)應用的問(wèn)題在這里依然存在。

  由于應用環(huán)境日趨復雜,要正確評估一個(gè)移動(dòng)設備處理器的性能變得越來(lái)越復雜,因為現在的移動(dòng)設備跑的網(wǎng)頁(yè)瀏覽、三維游戲、音視頻、人工智能等都不可能可以完全塞進(jìn)L1 Cache里,因為這些應用牽涉到大量的數據處理。

  這時(shí)候,人們在臺式機性能評估上學(xué)到的經(jīng)驗和測試辦法就可以在移動(dòng)設備上采用了。對CPU測試來(lái)說(shuō),最合理的測試方式是采用多種計算規模的真實(shí)應用源代碼以本機代碼進(jìn)行編譯再進(jìn)行測試,在這樣的情況下移動(dòng)設備的計算單元、內存單元都得以充分考驗,測試結果最具參考價(jià)值。

  能夠獲得業(yè)界(計算機工業(yè)、學(xué)術(shù)科研)官方認可的CPU測試當屬SPEC.org的SPEC CPU,它就是采用源代碼方式,讓測試人員可以編譯為本機代碼來(lái)測試,許多處理器在研發(fā)伊始就采用SPEC CPU作為最重要的性能評估指標。

  SPEC CPU的最新版本為CPU2006,但是CPU2006針對的是當前的臺式機、工作站、服務(wù)器處理器應用環(huán)境,內存容量(CPU2006 支持多線(xiàn)程測試,因此要求的內存容量相當高,8線(xiàn)程處理器用16 GB內存也是有點(diǎn)勉強)和自身存儲空間(未編譯時(shí)就要數GB空間,編譯后就要占用1xGB了)要求都較高,因此采用CPU2006對目前的移動(dòng)設備來(lái)說(shuō)是不太現實(shí)的。

  SPEC CPU是每隔幾年就更新一次,在CPU2006之前的舊版本為CPU2000,它的speed整數性能測試完全可以在1GB級別的移動(dòng)設備上運行,在以前甚至有一些 CPU2000的測試被移植到GPU上做加速性能測試。

  ARM陣營(yíng)極少公布SPEC CPU測試結果,這當然也是有原因的,因為在過(guò)去的不少時(shí)間里,ARM針對的設備大都只有幾百兆內存空間,塞進(jìn)操作系統后,留給程序運行的空間就更少,此外由于省電先決的考量ARM處理器的性能其實(shí)真的不怎么樣。

  不過(guò)有意思的是,今年ARM陣營(yíng)里的NVIDIA在發(fā)布Tegra 4的時(shí)候公布了CPU2000INT的測試結果:在1.9GHz 頻率設定的NVIDIA參考平臺里,Tegra 4的SPEC PU2000int_base 為1168。這個(gè)測試結果相當于2003年第四季度 SPEC.org 上公布的AMD K8 Sledgehammer 2GHz測試結果。

  NVIDIA還進(jìn)行了在小米手機2(采用高通 Snapdragon S4 Pro 即 APQ8064 1.7GHz)上的CPU2000測試,并且根據高通公布的S800相對S600在IPC(每周期指令)和頻率上的變化幅度而估算出來(lái)的S800的CPU2000測試結果:

  

  從圖表來(lái)看,S600的CPUINT2000_base測試結果相當于Tegra 4的一半不到,這在很大程度上反映了Cortex-A15相對Krait系處理器的真實(shí)應用差別。

  需要指出的是,雙方的測試平臺本身也是有一些影響的,例如小米手機2執行這個(gè)測試的時(shí)候,CPU頻率是否存在降頻現象,NVIDIA對此沒(méi)有說(shuō)明。

  一般來(lái)說(shuō),像APQ8064在四核全速運行的時(shí)候,會(huì )在一段時(shí)間內由于過(guò)熱而導致頻率從最高的1.7GHz開(kāi)始下降。當然,NVIDIA在這里公布的是speed模式下的CPU2000INT測試結果,這個(gè)模式下是單線(xiàn)程的測試,只有一個(gè)CPU內核會(huì )被使用。

  比較遺憾的是高通對這個(gè)測試結果尚未提出異議(據說(shuō)高通對于處理器性能的孰高孰低并不十分看重,他們戲稱(chēng)是賣(mài)基帶送CPU),而CPU2000的配置對一般人來(lái)說(shuō)是相當復雜的事情,所以這個(gè)測試暫時(shí)沒(méi)有第三方使用同樣的平臺測試佐證。

  威盛電子在發(fā)布Nano X2處理器的時(shí)候曾經(jīng)公布過(guò)一份文件,里面也有采用CPU2000對Nano X2 1.2+GHz和Atom D525進(jìn)行測試,其中g(shù)cc編譯器出來(lái)的CPU2000 INT成績(jì)分別為799和582,采用Intel編譯器出來(lái)的成績(jì)分別是955和725。

  NVIDIA的Tegra 4的CPU屬于A(yíng)RMv7A指令集,因此編譯器很可能是armcc或者gcc,NVIDIA新近收購的PGI是一家老牌編譯器廠(chǎng)商,也許它能提供內部測試版給 NVIDIA,只是PGI過(guò)往從未發(fā)布過(guò)ARM系編譯器。

  到這里,大家應該對Cortex-A15的架構特點(diǎn)以及和它的一些競爭對手在性能上的區別有大致的了解,不過(guò)這樣的旗艦級處理器在智能設備的實(shí)際應用情況又如何呢?

  有采用四核Cortex-A15手機了嗎?

  這個(gè)問(wèn)題其實(shí)來(lái)自于一些人的猜測,我們看見(jiàn)一些文章認為Cortex-A15的性能高但是功耗大,并不一定適用于手機。

  這個(gè)問(wèn)題放在一年前的話(huà)可能會(huì )有各種不同的答案,但是現在是2013年8月下旬,答案已經(jīng)非常清晰:已經(jīng)有采用四核Cortex-A15的手機上市,而且會(huì )有更多的采用Cortex-A15的手機上市,這也為Cortex-A15是否適用于手機的爭論畫(huà)上了一個(gè)句號。目前,明確可用于手機的Cortex-A15架構的四核移動(dòng)處理器主要有兩種,一種是三星的Exynos Octa,另外一種是NVIDIA Tegra 4。

  三星公司在4月27日上市的Galaxy S4有多個(gè)型號,但是從處理器來(lái)分,就分為兩種機型:高通Snapdragon 600和三星Exynos 5410。

  S600其實(shí)類(lèi)似于去年大紅大紫的APQ8064,CPU微架構為Krait 300,相對APQ8064的Krait微架構來(lái)說(shuō),它增加了硬件數據預取器,能預先將數據從內存中抓到L2 cache里。除此以外Krait 300還改善了分支預測的準確度,這些變化能改善Krait 300的IPC(每周期指令)大約15%,加上最高頻率提升至1.9GHz(取決于手機廠(chǎng)商,像HTC One就選擇了較低的或者說(shuō)和APQ8064上限一樣的1.7GHz),因此可以認為S600的CPU性能比之前的S4 Pro最多提升了大約28.5%左右,更接近于Cortex-A15的性能,不過(guò)它使用的制程和S4 Pro一樣依然是28nm LP,這個(gè)制程沒(méi)有在漏電流上作優(yōu)化,因此在耗電方面S600比S4 Pro更大。

  為什么三星不選擇單一型號處理器的方式呢?首先三星肯定要支持自家研發(fā)的處理器,這是毫無(wú)疑問(wèn)的,因此基于Cortex-A15的E5410自然成了配置之一;其次是三星作為一家韓國公司,同時(shí)也是一家跨國公司,產(chǎn)品需要賣(mài)向全球,有些的確已經(jīng)邁向了4G LTE,有些則還是3G時(shí)代,面對世界各地的通信制式、合作運營(yíng)商的要求以及全球行銷(xiāo)的潛規則,高通方面的產(chǎn)品是不得不考量的,因此在這里也把定位比較接近的S600作為另一種配置以支持LTE。

  

  三星Galaxy S4 GT-I9500主電路板正面

  

  三星Exynos 5410管芯圖,深色部分是四核A15區域,粉紅色部分是四核A7區域

  在國際版的GT-I9500(以及中國大陸區的聯(lián)通版、電信版)采用的三星Exynos 5 Octa內部型號為Exynos 5410,CPU部分是一組四核Cortex-A15加另一組四核 Cortex-A7的搭配方式。不過(guò)Exynos 5410只支持big.LITTLE模式里的IKS(核內切換器),不支持GTS(全局任務(wù)調度)模式,因此看上去雖然有物理上的八個(gè)內核,但是本質(zhì)上同一時(shí)間內最多只能實(shí)現同時(shí)使用四核A15或同時(shí)使用四核A7,如何切換則是由根據當前任務(wù)的負荷性質(zhì)決定。

  NVIDIA Tegra 4推出多個(gè)月后,除了自家的SHIELD和HP、華碩以及東芝等廠(chǎng)商的筆記本電腦外,還會(huì )被用于一些手機里面,目前已經(jīng)公布的有中興的U988S,據聞還會(huì )有更重量級的手機隨后出來(lái)。

  

  NVIDIA Tegra 4管芯圖,橙色區為4+1Cortex-A15核心,綠色小方塊區域為GPU

  Tegra 4和三星Exynos 5410的主CPU都采用了四核Cortex-A15,不過(guò)NVIDIA沒(méi)有采用ARM的big.LITTLE結構,而是采用自己4+1核的結構,4+1 中的“1”被稱(chēng)作伴侶核。

  “伴侶核”是一個(gè)采用省電設計、運行在較低頻率下的Cortex-A15內核,用于處理負載較輕的任務(wù)以達到省電的目的,一旦負載較重就會(huì )切換到主CPU核上。

  和Cortex-A15+Cortex-A7的big.LITTLE相比,這樣的設計據稱(chēng)有兩個(gè)好處:

  首先,是由于“伴侶核”與主CPU核心架構完全一樣,CPU切換時(shí)(或者說(shuō)程序執行的現場(chǎng)切換)的時(shí)間比Cortex-A15切換到Cortex-A7的方式快很多,這是因為不用進(jìn)行復雜的映射;

  其次,Cortex-A15的單核性能比Cortex-A7高很多,因此大多數一般的應用中并不需要頻繁切換到主CPU,從而達到更省電的目的。當然,具體的耗電情況需要等到設備出來(lái)后進(jìn)行詳細測試。

  在商業(yè)社會(huì )里衡量一款產(chǎn)品是否成功,關(guān)鍵的指標之一自然是出貨量。按照Digitimes援引TrendForce(集邦科技)在今年七月末的一份研究報告,三星Galaxy S4的出貨量將會(huì )達到2300萬(wàn)部的總出貨量,而在更早之前已經(jīng)有媒體報道指出三星Galaxy S4的出貨量“已經(jīng)”達到兩千萬(wàn)臺。

  如果只是靠品牌知名度和好不好看的話(huà),任何產(chǎn)品也不可能做到快速的大量出貨,Galaxy S4作為旗艦級產(chǎn)品,它的規格配置在吸引力方面起到了很大的作用,四核Cortex-A15或者四核S600的采用是它成功的關(guān)鍵因素之一,這些成功反過(guò)來(lái)也會(huì )對人們的品牌認受度產(chǎn)生正面印象。

  

  上圖就是我們前面提及的預期購買(mǎi)手機品牌調查百分比,可以看到在三星發(fā)布了Galaxy S4第一季度到第二季度變化值是呈上升態(tài)勢,而蘋(píng)果方面則是依然不斷地下滑。

  所以從這一小節中我們可以得出結論,市場(chǎng)上已經(jīng)有四核Cortex-A15手機上市,而且從市場(chǎng)趨勢來(lái)看這樣的產(chǎn)品已經(jīng)獲得了實(shí)質(zhì)性的認可。

  不同型號的Cortex-A15芯片設計是否一樣呢?

  

  ARM的實(shí)驗室里雖然也有自己開(kāi)發(fā)的處理器實(shí)體,但是這些處理器是作為研發(fā)之用,不會(huì )拿出來(lái)賣(mài)給最終消費者的,市場(chǎng)上的“ARM”處理器都是ARM透過(guò)架構授權或者內核授權的方式由第三方廠(chǎng)商開(kāi)發(fā)或者拼湊而成。

  因此在市場(chǎng)上你會(huì )看到五花八門(mén)、各式各樣的ARM處理器,它們來(lái)自不同的芯片設計公司、不同的制造廠(chǎng)商,由于設計技術(shù)水平、經(jīng)驗以及制造廠(chǎng)的制程不同,實(shí)際上出來(lái)的芯片在一些指標、功能上會(huì )有不可忽視的區別。

  就譬如我們這里提到過(guò)三星Exynos 5410和NVIDIA Tegra 4,CPU都采用了四核Cortex-A15,但是兩者的區別其實(shí)多,例如:

  1、Exynos 5410采用三星的28nm LP HKMG制程,最高頻率設定是1.6GHz,Tegra 4采用臺積電的28nm HPL制程,最高設定頻率為1.9GHz;

  2、Exynos 5410采用了A15*4 + A7*4的設計,Tegra 4 采用了高頻A15*4+低頻(700~800MHz)低耗電A15*1的設計;

  3、兩者的GPU截然不同,Exynos 5410采用了ImgTec授權的PowerVR SGX544MP3 (tri-core) @480MHz,Tegra 4 采用的是NVIDIA自己開(kāi)發(fā)的GPU架構,幾何單元為單精度浮點(diǎn),像素單元為20位浮點(diǎn),這應該是吸取了當年GeForce FX世代受挫的經(jīng)驗而特別炮制的平衡設計。

  4、兩者的die size(管芯尺寸)不一樣,Exynos 5410按照EDN的說(shuō)法應該是122mm^2,而Tegra 4大約是80mm^2,后者比前者小了大約33%,Tegra 4的設計目標更偏向于性能、耗電、成本三者的平衡,而三星由于采用的PowerVR是屬于分塊式延后渲染器(TBDR),因此片上需要有TBDR獨有的電路,這些電路會(huì )增加不少面積。

  從這一小節我們可以看出,同樣是采用四核A15的處理器,在很多方面都是完全不一樣的,這將對處理器的功能、性能、耗電構成不少的影響,最終反映到終端設備——手機、平板電腦上的表現也會(huì )有一定的差別。

  同一款處理器不同版本在耗電上一樣嗎?

  NVIDIA在較早之前發(fā)布的SHIELD采用的是前面提到的Tegra 4處理器,這是NVIDIA的第四代Tegra處理器,和其他手機SoC芯片廠(chǎng)商有多款不同芯片供選擇不同的是,NVIDIA這幾年走的都是單芯片多型號路線(xiàn),也就是把芯片單純按照頻率、GPU使能規模來(lái)劃分多個(gè)型號供客戶(hù)選擇。

  

  SHIELD 采用的Tegra 4具體型號是T40,是Tegra 4的頂級性能版本,最高頻率設定為1.9GHz,GPU規模使能規模為72 core但是頻率多少并不清楚,Tegra 4 GPU的文檔有提到在672MHz時(shí)候的性能規格,但是這不代表T40的GPU就是這樣的規格。

  不過(guò)手機顯然不會(huì )上這樣規格的Tegra 4,因為SHIELD的形制較大,可以塞進(jìn)風(fēng)扇輔助散熱,電池容量也可以支持這樣規格跑接近10小時(shí)的游戲,即使是旗艦級別手機的個(gè)頭只有它的三分之一不到。

  NVIDIA提供的手機版Tegra 4型號為AP40,這個(gè)版本在多個(gè)方面做了精簡(jiǎn),例如T40有很多的I/O口,AP40只保留了必要的,溫控的策略也會(huì )有不同。

  從一些廠(chǎng)商提供的消息,經(jīng)過(guò)這些精簡(jiǎn)后,AP40的TDP(熱設計功率,代表能讓設備低于結溫所需的散熱能力)從T40的8-10瓦降低到了3瓦級別,這相當降低到了1/3不到,變化非常大。

  那么功率降低到這么多,性能是否會(huì )有大的下降呢?這是一個(gè)有趣的問(wèn)題。不同的廠(chǎng)商會(huì )采用不同的功耗控制策略。 一般在多核心同時(shí)高負荷工作下,手機的處理器工作速度會(huì )隨著(zhù)溫度的上升而降低,從而把總的功耗降到較低的水平。

  不過(guò),單核心工作的時(shí)候,頻率的下降速度就會(huì )慢很多。而且大部分的情況下,CPU高負荷的往往是間歇性的,對于大部分的應用,實(shí)際的性能應該不會(huì )有什么影響。

  CPU性能的重要性

  Cortex-A15 相對于S600、S800、Cortex-A9、Cortex-A7 等“對手”來(lái)說(shuō)優(yōu)勢就是具備更強的單核心性能。在多線(xiàn)程程序并不十分普及的情況下,單核心性能的重要性是毋庸置疑的。

  其實(shí)無(wú)論是手機還是我們的臺式機、筆記本電腦,日常的不少程序都采用單線(xiàn)程代碼。多線(xiàn)程程序的開(kāi)發(fā)需要比較復雜的代碼編寫(xiě)、經(jīng)驗以及調試,而且很多任務(wù)并不容易做到并行化,因此經(jīng)過(guò)很多年以后,實(shí)際上真正的多線(xiàn)程重負荷的程序即使在PC上也并不普遍,在移動(dòng)平臺上就更少了。

  除了一些專(zhuān)門(mén)用來(lái)燒機的軟件外,能讓多核尤其是四核手機老是處于跑滿(mǎn)狀態(tài)的應用可說(shuō)是少之又少,更常見(jiàn)的情況是某些高計算負荷的任務(wù)讓四核沖起來(lái)一下就跑完了。

  舉個(gè)簡(jiǎn)單的例子,例如刷微博或者刷網(wǎng)頁(yè)的情況,里面包含很多圖文的信息,刷的時(shí)候速度快的處理器能夠很快地顯示出內容,而速度較慢的處理器則需要等待一段時(shí)間。

  刷完以后CPU總的占有率會(huì )驟然降低,之后都是一些單線(xiàn)程的程序讓個(gè)別內核處于較飽滿(mǎn)的負載狀態(tài)。

  真正需要CPU高負荷的時(shí)間占總時(shí)間的比例很低,甚至連1%都遠遠不到,但是這個(gè)時(shí)間雖說(shuō)很短,卻往往是影響用戶(hù)體驗的一個(gè)非常重要的因素。

  因此,CPU的峰值性能的重要性毋庸置疑。此外,現在有一種趨勢,移動(dòng)處理器面對的屏幕分辨率甚至普遍比筆記本電腦甚至臺式機更高,這意味著(zhù)界面的處理壓力越來(lái)越高。

  界面的刷新和網(wǎng)頁(yè)刷新的情況類(lèi)似,對CPU的性能要求高,但是時(shí)間短,用戶(hù)的體驗感受很直接。

  因此更高的處理器速度也將是一種硬性的需求,而不是可有可無(wú)的擺設。但是對于性能和功耗的評估需要有理性的分析,有一些人一味強調拷機軟件下的CPU頻率過(guò)熱降頻情況對手機用家來(lái)說(shuō)其實(shí)是某種程度的誤導,這和實(shí)際的應用情況完全不一樣。

  

  多核處理器的意義更多在于多任務(wù)的情況。Android和Windows都是典型的多任務(wù)操作系統,多核處理器在處理多任務(wù)的時(shí)候大大提升了多個(gè)程序同時(shí)運行時(shí)的處理和響應速度。

  不過(guò),多任務(wù)對于核心數量的需求是有限的,PC CPU和移動(dòng)處理器主流的核心都是兩到四核,這不是偶然的。

  雖然系統中有多個(gè)線(xiàn)程和多個(gè)任務(wù)同時(shí)存在,但是出于活躍狀態(tài)的往往也就少數幾個(gè),因此更多的CPU核心意義是不大的?,F在有些廠(chǎng)商推出的所謂八核Cortex-7的處理器,在絕大部份的情況下性能一定還不如雙核Cortex-A15。

  ARM推出A12就等于否定A15?

  ARM是一家非常純粹的設計公司,它并不向終端消費者、廠(chǎng)商出售任何處理器,而是提供授權給第三方公司,讓其自行設計或者堆砌出自己的處理器。

  這樣的好處是它可以節省掉一大筆行銷(xiāo)上的資源,ARM設計一款處理器內核并不會(huì )產(chǎn)生任何庫存壓力,它只消告訴廠(chǎng)商這個(gè)處理器如何做對接以及可以用來(lái)干嘛就可以了,接下來(lái)就是等著(zhù)收錢(qián)了。

  在這樣的情況下,ARM可以做到非常靈活多變,當看到市場(chǎng)上(也許是將會(huì ))存在空擋時(shí)候,就能很快推出相應的“產(chǎn)品”。按照時(shí)間來(lái)看,Cortex-A12的推出其實(shí)就是瞄準了Cortex-A7/A53和Cortex-A57之間的空隙,屬于未來(lái)一年后的中端偏低市場(chǎng)的主力。

  在Cortex-A12推出后,有些人就馬上下結論,這代表了ARM對Cortex-A15在手機應用上的否定。

  如果以big.LITTLE布局來(lái)看Cortex-A12屬于A(yíng)RM產(chǎn)品規劃中的big,也就是偏向性能先決的內核,目前確定的制程包括了GlobalFoundries的SLP-28和臺積電的28 HPM。Cortex-A12和Cortex-A9一樣是雙發(fā)射亂序執行,但是和A9相比,A12的亂序執行不僅限于整數流水線(xiàn),而是浮點(diǎn)流水線(xiàn)和內存操作都具備了亂序執行。

  此外 A12實(shí)現了VFPv4浮點(diǎn)單元并且將Neon向量單元列為標準配備,Coremark測試可以做到單核3.0 DMIPS/MHz,相比之下A9 和A15 分別是2.5和35。

  所以很明顯,A12性能處于A(yíng)9和A15性能之間,這對ARM來(lái)說(shuō)是很正常不過(guò)的事情。事實(shí)上ARM在發(fā)布A12的同時(shí)還更新了A9,提到A9 r4版的性能更新,按照幻燈片,對分支預測和內存子系統作改進(jìn)后的r4在IPC 上能做到初版A9 的1.4倍左右。

  

  Cortex-A9至今已經(jīng)有多個(gè)版本,見(jiàn)上圖的r1-r4描述

  如果單看IPC的話(huà),A9 r4是不是和A12很類(lèi)似?那如果按照某些人的思維,A9 r4豈不是可以用來(lái)否定A15?

  目前A9 r4已經(jīng)在NVIDIA Tegra 4i里面采用,按照NVIDIA的數據,在BBench中相比A9 r1有25%的性能提升,而在SPECint 2000中也有15%的性能提升,基于Tegra 4i的終端很可能會(huì )在明年第一季度就能看到,而A12還沒(méi)有任何廠(chǎng)商宣布采用,A15即使退下火線(xiàn)也未必是因為A12的出現,因為A15的定位接替者其實(shí)是基于A(yíng)RMv8的 A57。

  余論與后記

  

  看到這里,相信大家已經(jīng)基本了解了Cortex-A15大致架構和性能、定位,而配備四核Cortex-A15的三星Galaxy S4手機已經(jīng)取得了非常矚目的成功。

  不同廠(chǎng)商、不同型號的四核Cortex-A15處理器在很多方面都存在不少的差別,這些差別或因為設計意念、經(jīng)驗,或因為各自在某領(lǐng)域的優(yōu)勢,或因為產(chǎn)品定位,或因為制程,這些差別讓我們不能簡(jiǎn)單地類(lèi)比,例如直接把某型號的Cortex-A15四核處理器在性能、功耗的指標類(lèi)推到另一型號上。

  手機性能測試是比較特殊的,它是一個(gè)封閉的東西,從硬件角度看,絕大多數情況下你不能把里面的東西卸下來(lái)拿到另一部不同型號的手機里測試來(lái)驗證不同硬件組合下的影響,從軟件角度看,目前缺乏足夠的工具和經(jīng)驗了解在測試的時(shí)候到底發(fā)生了什么,到底是廣譜的優(yōu)化還是定制優(yōu)化非知情者是很難了解的。

  對于手機來(lái)說(shuō),單線(xiàn)程的性能同樣不容忽視,這和多線(xiàn)程代碼編寫(xiě)的難度有直接關(guān)系,現實(shí)中許多應用還是基于單線(xiàn)程的,在此時(shí)Cortex-A15的單線(xiàn)程性能優(yōu)勢就能體現出來(lái)。

  在日常應用中沒(méi)有多少應用會(huì )像拷機程序那樣長(cháng)時(shí)間持續的四核全部跑滿(mǎn),尤其是在手機應用中,在手機測試中采用這類(lèi)程序到底有多少意義是令人懷疑的,手機用家真的會(huì )整天沒(méi)事呆看手機跑StabilityTest之類(lèi)的東西嗎?

  Cortex-A12上市的時(shí)間點(diǎn)可能是明年下半年以后的事情,它的性能定位就是接替Cortex-A9,而Cortex-A15的接替者將會(huì )是Cortex-A57,Cortex-A12在此時(shí)(A57時(shí)代)扮演的就是中階偏低的角色。

  總之,我相信在未來(lái)的一年里,Cortex-A15四核版的手機將會(huì )越來(lái)越多,相應的芯片型號也會(huì )層出不窮,其中應該不乏成功的產(chǎn)品



關(guān)鍵詞: Cortex-A15 ARM

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>