ARM Cortex-A55: 從端到云實(shí)現高效能
你是否已經(jīng)聽(tīng)說(shuō)了最近市場(chǎng)上發(fā)布了幾款新的 CPU?它們的性能非常強大!當然,我說(shuō)的就是 ARM Cortex-A75 和Cortex-A55,即首批基于新近發(fā)布的DynamIQ 技術(shù)的Cortex-A系列處理器。本文我們討論的就是 Cortex-A55:一款對為未來(lái)數字世界舉足輕重的處理器。下面就隨單片機小編一起來(lái)了解一下相關(guān)內容吧。
本文引用地址:http://dyxdggzs.com/article/201808/388106.htm出生名門(mén),久經(jīng)考驗

想要理解 Cortex-A55 的真正潛力,我們來(lái)簡(jiǎn)要回顧一下其上一代產(chǎn)品:ARM Cortex-A53。采用這款 CPU 的設備已超過(guò) 15億臺,該 CPU 依然是當今業(yè)界出貨量最高的 64 位 Cortex-A 系列 CPU。Cortex-A53 于 2012 年發(fā)布,其獨一無(wú)二的設計,集性能、低功耗以及尺寸擴展性于一身,具備一系列多用途特性,因而可應用于諸多市場(chǎng),其中包括高端智能手機、網(wǎng)絡(luò )基礎設施、汽車(chē)信息娛樂(lè )、高級駕駛員輔助系統 (ADAS)、數字電視、入門(mén)級移動(dòng)設備和消費級設備乃至人造衛星。
然而自 2012 年以來(lái),我們周?chē)氖澜绨l(fā)生了許多變化。我們現在看到的新興趨勢表明,保持互聯(lián)、萬(wàn)物智能的數字世界具有非常大的發(fā)展潛力。從完全自主的自動(dòng)駕駛汽車(chē)到各類(lèi)設備上的智能應用程序,人工智能 (AI) 和機器學(xué)習 (ML) 將真正融入到我們的日常生活中,這一點(diǎn)已成定局。物聯(lián)網(wǎng) (IoT) 應用的盛行意味著(zhù)“物”的爆炸性增長(cháng),越來(lái)越多的“物”在持續生成數據、消費數據以及與數據進(jìn)行交互。增強現實(shí)、虛擬現實(shí)以及混合現實(shí) (AR、VR 以及 MR) 注定會(huì )徹底改變我們人類(lèi)之間以及人機之間的互動(dòng)方式,將現實(shí)世界與數字世界融于一體。
在過(guò)去兩年里,ARM 的工程師致力于研究 Cortex-A53 的后繼產(chǎn)品,以滿(mǎn)足這類(lèi)新興技術(shù)的需求,我們的目標是打造出一款性能、效能以及擴展性均大幅提升的 CPU,而且這款 CPU 還需要具備諸多先進(jìn)的特性,從而滿(mǎn)足從端到云的各種未來(lái)應用需求,幸運的是我們做到了。
性能全面提升

Cortex-A55 采用最新的 ARMv8.2 架構,并在其前代產(chǎn)品的基礎上打造而成。它在性能方面突破了極限,同時(shí)依舊保持了與 Cortex-A53 相同的功耗水平。我們盡全力改進(jìn) Cortex-A53,并賦予其以下特性:
· 在相同的頻率與工藝條件下,內存性能最高可達 Cortex-A53 的兩倍
· 在相同的頻率與工藝條件下,效能比 Cortex-A53 高 15%
· 擴展性比 Cortex-A53 高十倍以上
這些歸功于我們專(zhuān)注于 Cortex-A53 現有的設計理念并挑戰這些理念。
· 我們對分支預測程序(branch predictor)進(jìn)行了全面修改,在其算法中融入了神經(jīng)網(wǎng)絡(luò )元素來(lái)改進(jìn)預測。此外還新增了零周期分支預測程序(Zero-cycle branch predictor)以便進(jìn)一步減少流水線(xiàn)中的泡沫。這樣可以使指令之間的空閑時(shí)間越來(lái)越短。
· 我們的設計是,使二級高速緩存對每一顆 CPU 而言都是專(zhuān)用緩存,這樣一來(lái)與 Cortex-A53 相比,二級高速緩存的存取時(shí)間縮短了 50% 以上。我們還將二級高速緩存的工作頻率設計成與 CPU 相同的頻率。通過(guò)降低延遲大幅提升 CPU 在各類(lèi)基準測試工具中的性能。
· 我們推出了三級高速緩存,可供集群內的所有 Cortex-A55 CPU 共享。這讓 DynamIQ 集群能夠得益于 CPU 附近增多的內存容量,從而提升性能、降低系統功率。三級高速緩存是 DynamIQ 共享單元 (DSU) 的一部分,DSU 是DynamIQ 處理器中的一個(gè)新的功能單元。
· 8 位整數矩陣乘法對神經(jīng)網(wǎng)絡(luò )性能的影響超過(guò)85%。Cortex-A55 NEON流水線(xiàn)中增添了新的架構指令,使其能夠在每個(gè)周期執行 16 次 8 位整數運算。這些新的指令還使該 CPU 能夠在每個(gè)周期執行 8 次 16 位浮點(diǎn)運算、對兩條 MAC 指令進(jìn)行舍入操作,有利于色彩空間轉換。
相較Cortex-A53,實(shí)現效能的大幅提升

對分支預測程序、NEON 和 FP 單元的上述改進(jìn)以及內存延遲的縮短僅僅是 Cortex-A55 取得大幅性能提升的部分原因。Cortex-A55 不但實(shí)現了大幅性能提升,而且保持了與 Cortex-A53 相類(lèi)似的功耗??偠灾?,Cortex-A55 在節能性方面實(shí)現了 15% 的提升。相對于性能而言,功率在產(chǎn)品設計中更加重要。在提供同等性能的情況下,Cortex-A55 消耗的功率比 Cortex-A53 低 30% 之多!
Cortex-A55提供持續性能的時(shí)間遠比當今的 Cortex-A53 解決方案更長(cháng)。這一點(diǎn)對于 AR、VR 以及 MR 等領(lǐng)域的用戶(hù)體驗而言至關(guān)重要,這些領(lǐng)域預計將會(huì )在未來(lái)移動(dòng)市場(chǎng)上占據主導地位。這些使用場(chǎng)合已經(jīng)高度線(xiàn)程化,對延遲有嚴格的要求。后者指的是移動(dòng)時(shí)間延遲,根據行業(yè)研究,這種延遲需要保持在 20 毫秒或以下,這樣才不會(huì )導致惡心和頭暈。雖然當今的 CPU 已經(jīng)實(shí)現了達到 20 毫秒延遲所需的性能水平,但是發(fā)熱限制意味著(zhù)這些 CPU 無(wú)法長(cháng)時(shí)間維持這樣的性能水平。有了 Cortex-A55,我們就能給出未來(lái) VR 設備中延長(cháng)持續性能時(shí)間的解決方案。

行業(yè)領(lǐng)先的效率讓 Cortex-A55 在基礎設施市場(chǎng)卓爾不群。以太網(wǎng)供電 (PoE) 無(wú)線(xiàn)接入點(diǎn)以及安裝在后視鏡上的發(fā)熱受限的汽車(chē)解決方案等應用均可利用熱效率極高的 Cortex-A55 在特定的發(fā)熱范圍內提供最高性能。在 5G 遠程無(wú)線(xiàn)電頭端 (RRH),Cortex-A55 CPU 還能夠在特定功率范圍內最大限度增加網(wǎng)絡(luò )吞吐量。
從端擴展至云

評論