<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 將大小計算引擎完美地整合在-起

將大小計算引擎完美地整合在-起

作者: 時(shí)間:2016-11-10 來(lái)源:網(wǎng)絡(luò ) 收藏
本文介紹了ARM最新型的Cortex-A7+Cortex-A15處理器的異構多核配置,以實(shí)現性能功耗的最優(yōu)。在當今移動(dòng)世界里,特別是在超便攜移動(dòng)世界(尤以智能手機和平板電腦為主)里出現了一些令人抓狂的類(lèi)似事件。這些手機運行或設想運行的應用程序類(lèi)型,像現實(shí)增強和內容創(chuàng )建,使用更大屏幕的設備需要在極其重要的移動(dòng)熱能和電池限制條件下使處理能力的性能得到巨大的提升。由于這些設備還長(cháng)期處于開(kāi)機狀態(tài),并時(shí)常與 twitter feeds和facebook保持連接并推送電子郵件更新,因此它們還需要連續的低強度性能。最后,由于這些設備正在成為通信、消費和計算平臺的主流設備,因此我們希望能夠延長(cháng)電池壽命來(lái)維持我們終日繁忙的工作。

汽車(chē)設計方面,即使您仍然希望將大型車(chē)的高性能與經(jīng)濟轎車(chē)的高能效合而為一,但您在組合大小引擎時(shí)會(huì )發(fā)現第二個(gè)引擎太重了,這種做法太不現實(shí)。

本文引用地址:http://dyxdggzs.com/article/201611/317420.htm

而在移動(dòng)CPU世界里,我們已運用了這種概念:手機可以在同一芯片上集成CPU、圖形處理器、視頻引擎和音頻引擎等。每一組件可以在每單位的能耗中提供最大的性能和功能。因此如果在"V8引擎"CPU 中增加其他經(jīng)濟型 CPU 引擎,那么就會(huì )產(chǎn)生芯片占用面積上的投資回報率的問(wèn)題。但如果添加 ARM 的最新款 ARM Cortex-A7 CPU,即我們最小型的、最節能的應用處理器到至高端的 ARM Cortex-A15 CPU,則可以實(shí)現性?xún)r(jià)比最優(yōu)的理想產(chǎn)品,這具有非常重要的意義。我們稱(chēng)此概念為 big.LITTLE 處理:即將小型的、高能效的 ARM CPU 與完全兼容的高性能 ARM CPU 緊密地同步整合在一起。Cortex-A7 處理器以作為 big.LITTLE 對中的一款小型 CPU 與高端 Cortex-A15 CPU 完美地整合在一起為宗旨而設計。我將在本次簡(jiǎn)述中與您分享我們的實(shí)現過(guò)程。

我們首先要確保在引擎切換過(guò)程中不會(huì )出現"間歇性的運行狀態(tài)"。

在 big.LITTLE處理中,就意味著(zhù)必須確保小型CPU和大型CPU之間具有百分之百的軟件兼容性。從用戶(hù)和操作系統軟件的角度而言,大小內核必須保持外觀(guān)上的一致性。具體來(lái)說(shuō),就是在架構上保持一致。也就是說(shuō),Cortex-A15 和 Cortex-A7 處理器必須具有完全相同的指令、數據類(lèi)型和尋址模式,并且它們能夠產(chǎn)生相同的結果。在設計的其他領(lǐng)域也必須保持一致。如緩存線(xiàn)大小、40位物理地址空間、硬件虛擬化以及 128b AMBA 4 本地總線(xiàn)接口。

第二個(gè)關(guān)鍵要素就是確保具有最優(yōu)化的引擎…即在小型引擎上實(shí)現每加侖燃油的最大行程,而在 V8 引擎上實(shí)現最高的性能,并且不卡齒輪。

我們在 big.LITTLE 處理中使用的方法是在新一代移動(dòng)平臺的移動(dòng)剖面圖以及不同的功率剖面圖中確定關(guān)鍵的性能點(diǎn)。大 CPU (Cortex-A15) 旨在提供比當今高端 CPU 還要高的性能,并且滿(mǎn)足可使用在移動(dòng)電源裝置中。它由更復雜的、并行的、15 級或更高級的亂序管線(xiàn)組成,具體要根據指令流來(lái)確定。我們?yōu)樾⌒?CPU (Cortex-A7) 開(kāi)發(fā)了一種截然不同的由有序的 8 級管線(xiàn)組成的內核微體系架構,它能夠并發(fā)執行大部分常用的指令對。與高性能內核的 NEON SIMD 單位相比,針對更大介質(zhì)的 NEON SIMD 單位和浮點(diǎn)性能都有所降低。較小的 CPU 僅支持執行有序的指令,但仍支持所有相同的運算,如 64b 雙精度浮點(diǎn)計算、針對整數和單精度浮點(diǎn)數據類(lèi)型的雙字和四字 SIMD 運算。如果較小 CPU 的功耗和使用面積接近于較大的 CPU,那么通過(guò)切換所節省的能耗并不足以證明添加另一個(gè) CPU 群集的必要性。類(lèi)似地,如果較小 CPU 的性能不能與高性能內核相對媲美,那么它們之間的處理能力差異會(huì )因性能的不穩定而出現非連續性業(yè)務(wù)處理。因此,我們必須在性能和功效方面實(shí)現最優(yōu)化才能提供適合于 big.LITTLE 的 CPU。

我們需要確保的第三個(gè)問(wèn)題是恒定的線(xiàn)性加速和減速。在引擎切換之間沒(méi)有交接問(wèn)題。

arm.com/index.php?app=core&module=attach§ion=attach&attach_rel_module=blogentry&attach_id=1200" rel="nofollow" >

ARM 實(shí)現 big.LITTLE 處理的核心就是在較大 CPU 和較小 CPU 之間實(shí)現飛快的任務(wù)遷移。但是快速環(huán)境遷移所遇到的最大障礙是時(shí)間,也就是需要足夠的時(shí)間來(lái)清除出站 CPU 群集上的緩存并使其無(wú)效,同時(shí)使用有效的環(huán)境來(lái)替換無(wú)效的環(huán)境。較小 Cortex-A7 和較大 Cortex-A15 處理器均具有 AMBA 一致性擴展 (ACE) 接口,這些處理器可跨 ARM 緩存一致性互聯(lián)結構 (CCI-400)查看,在其他 CPU 群集的一級和二級緩存中執行查找操作。此功能的優(yōu)點(diǎn)就在于出站 CPU 群集只需要保存由寄存器文件、CP15 寄存器值以及安全狀態(tài)組成的小環(huán)境信息即可。然后在典型實(shí)現中,可以在總保存/恢復時(shí)間不到 20 微秒內,在入站CPU群集中恢復這一小環(huán)境信息(如較大 CPU 運行于 1GHz 或更快)。這種快速的環(huán)境切換具有很多優(yōu)點(diǎn)。由于切換的成本開(kāi)銷(xiāo)很低,因此電源管理框架可以確定是切換到小群集,即使很短的時(shí)間,也會(huì )節省能耗,還是切換到大 CPU 群集,以便在極短的時(shí)間里使性能瞬間達到最高。這種切換控制非常簡(jiǎn)單,因而進(jìn)行切換控制的軟件也非常簡(jiǎn)單。同時(shí),您可以在應用的中途進(jìn)行環(huán)境切換,如 CPU 開(kāi)始呈現網(wǎng)頁(yè)時(shí)可以啟用大 CPU,而在網(wǎng)頁(yè)得到呈現后可以切換到較小的 CPU,直至需要載入新網(wǎng)頁(yè)時(shí)才切換到大 CPU。因此無(wú)需把應用程序跨CPU 切割,SoC 的電源管理設備可以瞬間切換到相應大小的 CPU 元件中。

第四個(gè)也是最后一個(gè)需要確保的是這些引擎可以在一般情況下也能工作。

我們需要確保有一種簡(jiǎn)單的軟件方法來(lái)控制 big.LITTLE 切換,與現成的電源管理機制保持一致。當今的智能手機和平板設備將動(dòng)態(tài)電壓與頻率調節 (DVFS) 技術(shù)和多個(gè)空閑模式應用于應用處理器 SoC內單個(gè) CPU 內核和 IP 模塊上。我們所實(shí)施的 big.LITTLE 修改了后端驅動(dòng)程序來(lái)控制處理器的 DVFS 運行點(diǎn)(例如 Linux/Android 中的 cpu_freq)?,F在不再使用三個(gè)或四個(gè) DVFS 運行點(diǎn),而是通過(guò)驅動(dòng)程序來(lái)感知兩個(gè) CPU 群集,每個(gè)群集都可能具有三至四個(gè)獨立的電壓和頻率運行點(diǎn),從而擴大了現有智能手機電源管理解決方案使用的性能調節的范圍。big.LITTLE CPU 群集可以在純切換模式下進(jìn)行操作,即每一時(shí)刻只有一個(gè) CPU 群集在 DVFS 驅動(dòng)程序的控制下處于活動(dòng)狀態(tài),也可以在異構多處理模式下進(jìn)行操作,即操作系統可以為大型或小型 CPU 群集提供顯式線(xiàn)程分配控制,并因此感知不同內核的存在。

總而言之,ARM big.LITTLE 處理所具有的這些屬性可以為現代移動(dòng)設備提供最佳的兩種切換解決方案:與當今高端的智能手機應用處理器相比,其能耗節省了 70%,并且其最高性能比 2011款的最高端智能手機高很多。請注意這不是一個(gè)非此即彼的方案,而是在同樣的工作負載下使性能和能耗均達到最優(yōu)的解決方案。由于智能手機和平板電腦的工作負載具有高度動(dòng)態(tài)性,因此很有可能需要兩種切換模式。對于網(wǎng)絡(luò )瀏覽、視頻流、休閑游戲和 mp3 播放等重要的工作負載,應用 CPU 在最低的 DVFS 運行點(diǎn)中所用的運行時(shí)間占 70% 至 90%,而在最高的 DVFS 運行點(diǎn)中所用的運行時(shí)間僅不到 5% 左右。即使是高端的游戲工作負載或負載過(guò)重的互動(dòng)網(wǎng)站,其最高運行點(diǎn)也通常只占 CPU 運行時(shí)間的 20~30%,這樣便有機會(huì )切換到或將線(xiàn)程分配至小 CPU 中,使其 CPU 運行時(shí)間達到 70~80% 或更高。這可以很好地與 big.LITTLE 處理保持一致,其中較小 Cortex-A7 可以處理所有一般的任務(wù),但不能處理當前發(fā)售的高端應用處理器 CPU 的兩個(gè)最高運行點(diǎn)。這可以確保 Cortex-A7 在 80% 以上的 CPU 運行時(shí)間里提供所需的同一級別性能,這樣便大大地減少了能耗,然后再根據需要瞬間切換到高性能 Cortex-A15 CPU 以實(shí)現最大的性能。讓我們再回到汽車(chē)類(lèi)比中,這就像有一個(gè)處于待機狀態(tài)的渦輪增壓 V8 引擎在需要爬坡時(shí)從停止狀態(tài)突然加速,然后當您稍稍松開(kāi)油門(mén)時(shí),在不到一眨眼的功夫便切換到節能的引擎中。

如今在工程業(yè)界,我已領(lǐng)略到這世界上還真沒(méi)有免費的午餐。您不可能在既有高性能又有高能效的同時(shí),不付出一點(diǎn)代價(jià)。就本例而言我們需付出的是占用面積,相對于高性能的 CPU 本身而言,附加的 CPU 群集只占用很少的一點(diǎn)額外區域。而在 28nm 等現代工藝結構中,Cortex-A7 CPU 的每個(gè)內核所占用的面積不到一平方毫米的一半,因此片上成本的費用很低并且整合后的系統完全符合專(zhuān)為 CPU 群集定制的芯片空間大小要求。為了使平均能耗比當今主流智能手機更低,性能比當今具有最高性能的智能手機還高,即使必須在 SoC 上占用很少的一點(diǎn)額外區域也是相當劃算的。我只希望這種做法也能應用在汽車(chē)上:經(jīng)濟高效、長(cháng)行程、至高性能的夢(mèng)想車(chē)!



關(guān)鍵詞: cortex異構多核性能功

評論


技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>