ARM Cortex-A55: 從端到云實(shí)現高效能
除了性能與效率以外,Cortex-A55 的物理芯片尺寸以及計算性能也具有極高的擴展性。為此,它包含了多個(gè) RTL 配置選項,從而使可配置容量達到了 Cortex-A53 的十倍。事實(shí)上,它擁有 3,000 多種獨特的配置,因而成為了史上最具擴展性的Cortex-A CPU。
本文引用地址:http://dyxdggzs.com/article/201808/388106.htmCortex-A55 延續了 Cortex-A53 的靈活性,具備 NEON、Crypto 以及 ECC (糾錯碼) 等選項,但是也采用了新的實(shí)用配置選項。例如,專(zhuān)用二級高速緩存的可配置容量從 64KB 到 256KB 不等,可帶來(lái) 10% 的性能提升。專(zhuān)用二級高速緩存能夠很好地提升性能,而且它無(wú)疑會(huì )成為諸多市場(chǎng)的默認之選,它還被設計成了可選項,以便在物聯(lián)網(wǎng)等對尺寸敏感的市場(chǎng)上進(jìn)一步減小芯片尺寸。

DSU 無(wú)論在 Cortex-A55 還是在 Cortex-A75 上都很常見(jiàn)。它包含更多的配置選項,可根據用戶(hù)自身的應用情況進(jìn)行定制。例如 CPU 之間共享的三級高速緩存可從 0KB 擴展至最大 4MB。它還通過(guò) AMBA 5 ACE 或 CHI 支持多用途接口選項,從而可用于更廣泛的系統。加速器相干性端口 (ACP) 和低延遲外圍端口 (PP) 也被集成到 DSU 當中,這讓緊密耦合的加速器能夠連接至 Cortex-A55 以便處理通用計算。這些特性加上 Cortex-A55 的機器學(xué)習功能,讓更多的計算能夠在更靠近物聯(lián)網(wǎng)網(wǎng)關(guān)應用“端”的地方執行。
囊括諸多先進(jìn)特性,可用于各類(lèi)新興應用

人工智能會(huì )越來(lái)越普及,這已不是什么新鮮事。引申開(kāi)來(lái),我們的設備運行機器學(xué)習任務(wù)也會(huì )變得十分普遍。有多種方法可以在芯片上實(shí)現機器學(xué)習的處理,然而 CPU 在這方面擁有獨特的優(yōu)勢。CPU 可進(jìn)行通用計算,因此它可以運行到人工智能應用的芯片當中。目前機器學(xué)習和人工智能持續換代,固定功能的硬件不但價(jià)格昂貴,而且對機器學(xué)習而言容易過(guò)時(shí)。
對 Cortex-A55 NEON流水線(xiàn)的改進(jìn)和新增的機器學(xué)習指令意味著(zhù) Cortex-A55 在矩陣乘法運算方面的機器學(xué)習性能比Cortex A53要高出很多。最近發(fā)布的ARM 計算庫(ARM Compute Libraries)是專(zhuān)為 ARM Cortex-A NEON 和Mali GPU IP而優(yōu)化的入門(mén)級軟件函數集,它也可以應用于 Cortex-A55 NEON 并進(jìn)一步提升其機器學(xué)習性能!

Cortex-A55的可靠性、可用性和可服務(wù)性 (RAS) 特性也很高,這些特性使其能夠服務(wù)于基礎設施以及汽車(chē)等各個(gè)領(lǐng)域。對汽車(chē)市場(chǎng)而言,Cortex-A55 的安全性現已得到提升。它在每一級高速緩存上均提供可選的 ECC 和奇偶校驗特性,而且還支持“data poisoning”,這種方法可推遲已檢測到的、不可糾正的錯誤,適用于更有彈性的系統。它還是首款在避免系統故障方面采用全新設計流程的 Cortex-A 系列 CPU,因而在搭配Cortex-R52的情況下十分適合 ASIL D 應用。
深度嵌入高級電源管理特性

Cortex-A55具備諸多全新的電源特性,例如硬件控制狀態(tài)轉換能夠更快地從 ON 轉換至 OFF。Cortex-A55 還能夠根據當前運行的應用程序自主地關(guān)閉三級高速緩存。對于 VR 等需要更多內存的重載型應用程序,三級高速緩存會(huì )完全打開(kāi)。然而對于音樂(lè )播放等完全駐留在一級和二級高速緩存中的輕載型應用程序而言,三級高速緩存會(huì )被關(guān)閉。額外還有兩種功率模式用于重載和輕載之間的應用情形。
現在還可以創(chuàng )建單顆 CPU 或 CPU 群組,其中每一顆 CPU 都處于集群內各自獨立的電壓域中,因此能夠更精細地動(dòng)態(tài)提升電壓和頻率。這有兩大好處:首先,它讓設計師能夠進(jìn)一步調節系統,從而實(shí)現最佳的性能和節能性。其次,這還意味著(zhù) DynamIQ 系統能夠更輕松地緊密匹配設備多變的發(fā)熱限制,因此可以最大限度發(fā)揮性能。
big.LITTLE處理的新時(shí)代
big.LITTLE 技術(shù)自 2011 年問(wèn)世以來(lái)一直是異構處理的代名詞。因此當今市面上每三臺安卓 ARMv8 設備中就有兩臺依賴(lài) big.LITTLE 技術(shù)來(lái)實(shí)現功率和性能優(yōu)化。DynamIQ big.LITTLE是 DynamIQ 系統的新一代異構計算技術(shù)。
它讓設計師能夠利用 Cortex-A75 “大” CPU 和 Cortex-A55 “小” CPU 打造出充分集成的解決方案,大小 CPU 在物理上位于單一 CPU 集
它讓設計師能夠利用 Cortex-A75 “大” CPU 和 Cortex-A55 “小” CPU 打造出充分集成的解決方案,大小 CPU 在物理上位于單一 CPU 集群中。所有的軟件線(xiàn)程遷移和由此造成的大小 CPU 之間的高速緩存窺探(cache snoop)現在均發(fā)生在該集群內。與 Cortex-A73 相比,Cortex-A75 CPU 可以用于頻率更高的使用場(chǎng)合,同時(shí)利用Cortex-A55 依舊保持持續的 DVFS 曲線(xiàn)。這是 big.LITTLE 系統的一項重要設計要求。這些特性合在一起,與上一代 big.LITTLE 技術(shù)相比,可大幅提升峰值性能、持續性能以及智能功能。

當今的中端移動(dòng)和消費級市場(chǎng)普遍采用基于Cortex-A53的 4 核和 8 核解決方案。然而,隨著(zhù)人工智能和虛擬現實(shí)等高級使用場(chǎng)合從高端市場(chǎng)滲透到中端市場(chǎng),廠(chǎng)商需要以更低的成本提供更高的性能和智能功能。DynamIQ big.LITTLE 通過(guò)推出新的異構 CPU 配置來(lái)滿(mǎn)足這一需求,例如 1 顆 Cortex-A75 + 3 顆 Cortex-A55 (1大+3小) 和 1 顆 Cortex-A75 + 7 顆 Cortex-A55 (1大+7小) 等等。這些新的配置以類(lèi)似的芯片尺寸可分別與 4 核和 8 核的 Cortex-A55 設計相比,可以實(shí)現 2 倍以上的單線(xiàn)程性能。
評論