ARM big.LITTLE系統技術(shù)應用

一致性是實(shí)現快速轉移的重要因素,它允許監視并將保存在離埠處理器(outbound processor)的狀態(tài),在入埠處理器(inbound processor)上檢測與恢復,而不必通過(guò)主存儲器的存取。此外,由于離埠處理器的L2有高速緩存一致性(cache coherency)的功能,當任務(wù)轉移時(shí),可以透過(guò)檢測數據值的方式,改善入埠處理器的高速緩存預熱時(shí)間,此時(shí)L2高速緩存仍然可以維持供電狀態(tài)。不過(guò),因為離埠處理器的L2高速緩存無(wú)法提供新數據的配置, 最后還必須清除并關(guān)閉電源以節省耗電。
本文引用地址:http://dyxdggzs.com/article/147851.htmbig.LITTLE中央處理器轉移模式
至于中央處理器轉移,小核的處理器集群中每個(gè)處理器都對應了一個(gè)大核集群的處理器。中央處理器為成對配置(Cortex-A15及Cortex-A7處理器上同時(shí)配置CPU0、CPU1……依此類(lèi)推)。使用中央處理器轉移時(shí),每個(gè)處理器配對中在同一時(shí)間只有一個(gè)中央處理器能夠運轉。
系統會(huì )主動(dòng)檢測各處理器的負載。高負載時(shí)內容執行會(huì )轉移到大的核心,當負載較低,執行則會(huì )轉移到小的核心。不論何時(shí)每個(gè)配對中只有一個(gè)處理器可以運轉。當負載從離埠核心轉移到入埠核心時(shí),前者便會(huì )關(guān)閉。這種模式讓大核與小核的組合能隨時(shí)運轉。
big.LITTLE MP運作
由于big.LITTLE系統可以經(jīng)由CCI-400達到高速緩存的一致性,因此有另一種模式能讓Cortex-A15及Cortex-A7處理器同時(shí)運作并同步執行程序代碼,稱(chēng)為big.LITTLE MP(本質(zhì)上是一種異質(zhì)性多任務(wù)處理模型)。這是big.LITTLE系統最先進(jìn)且最具彈性的模式,能跨越兩個(gè)集群調整單一執行環(huán)境。在這種使用模式下,若線(xiàn)程有上述處理性能方面的需求,便可開(kāi)啟Cortex-A15處理器核心并同時(shí)通過(guò)Cortex-A7處理器核心執行任務(wù)。如果沒(méi)有這方面需求,則只需開(kāi)啟Cortex-A7處理器。在實(shí)際應用上,不同集群的處理器核心并不需要保持一致,而big.LITTLE MP更容易支持非對稱(chēng)的叢集。
移動(dòng)應用的特性
big.LITTLE技術(shù)具有優(yōu)勢的原因之一,就是普通情況下移動(dòng)應用工作量對性能的需求各有不同。圖5顯示的是目前搭載Cortex-A9的移動(dòng)設備中,兩個(gè)核心在DVFS、閑置與完全關(guān)機狀態(tài)下所花費時(shí)間的百分比。圖中紅色代表最高頻率的操作點(diǎn),綠色區塊則代表最低頻率操作點(diǎn),介于兩者的顏色則屬中級頻率。除了DVFS狀態(tài),操作系統電源管理也會(huì )使中央處理器閑置。圖中淺藍色區塊代表空閑時(shí)間。當中央處理器閑置的時(shí)間夠長(cháng),系統的電源控制軟件可能會(huì )完全關(guān)閉其中一個(gè)核心以節省耗電。圖中最深的顏色便代表這部份。

從圖5可清楚看出,應用程序處理器在好幾種普通工作量下,都有相當多時(shí)間處于低頻率狀態(tài)。在big.LITTLE系統里,系統級芯片(SoC)可利用耗能較低的Cortex-A7中央處理器,執行深紅色部分以外的所有工作。下圖則以相同方式分析了更為密集的工作量,而即使是在這樣的狀況下,在Cortex-A7處理器對應出低于1GHz的頻率的機會(huì )仍然很大。
性能與耗電分析:big.LITTLE測試芯片
2011年起,用戶(hù)層級軟件已能在big.LITTLE排程上運轉,不過(guò),那只是在處理器核心與互聯(lián)的軟件模型環(huán)境上發(fā)展。為完整評估big.LITTLE系統的性能、節能以及調校是否合適,必須打造一個(gè)能讓用戶(hù)軟件全速運轉的測試芯片。ARM的測試芯片早在2012年初夏即由制造廠(chǎng)完成,并在短短幾周內開(kāi)始搭配硬件開(kāi)發(fā)板(development board)運轉,支持完整版的Linux系統及安卓操作系統 Ice Cream Sandwich(Jelly Bean亦納入測試但本文引用結論均來(lái)自Ice Cream Sandwich)。這個(gè)測試芯片包含了一個(gè)雙核Cortex-A15集群、一個(gè)三核Cortex-A7集群,以及CCI-400高速緩存一致總線(xiàn)架構。會(huì )影響部分使用者評效基準的圖形處理器并不包括在內,但平臺仍可支持Linux、安卓操作系統以及性能測試軟件。
評論