<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 借力大小核設計架構 多核處理器強效又省電

借力大小核設計架構 多核處理器強效又省電

作者: 時(shí)間:2016-10-15 來(lái)源:網(wǎng)絡(luò ) 收藏

()晶片設計架構正快速崛起。在安謀國際()全力推廣下,已有不少行動(dòng)開(kāi)發(fā)商推出采用架構的新方案,期透過(guò)讓心分別處理最適合的運算任務(wù),達到兼顧最佳效能與節能效果的目的,以獲得更多行動(dòng)裝置制造商青睞。

本文引用地址:http://dyxdggzs.com/article/201610/307666.htm

近年行動(dòng)領(lǐng)域出現重大變革,智慧型手機已成為消費者聯(lián)網(wǎng)生活的主要工具,然而,這其中涉及各種高效能運算任務(wù)如高速網(wǎng)頁(yè)瀏覽、導航與游戲,以及語(yǔ)音通話(huà)、社群網(wǎng)路和電子郵件服務(wù)等效能需求較低的「持續運作,永遠連線(xiàn)」后臺任務(wù)。

與此同時(shí),平板裝置也正重新定義運算平臺,這些創(chuàng )新設計轉變均為消費者打造與內容互動(dòng)的全新方式,將原本只限于網(wǎng)路共享裝置(TetheredDevice)的功能導入行動(dòng)領(lǐng)域,創(chuàng )造出真正的智慧型新世代運算。

因應電子裝置的快速變革,未來(lái)半導體向來(lái)遵循的摩爾定律(Moore’sLaw)又將如何往下發(fā)展?過(guò)去,預測晶片的效能每隔18個(gè)月就會(huì )倍增,而現今電晶體的數量已從數千增加到數十億個(gè),但若仔細觀(guān)察單一,就會(huì )發(fā)現整體的效能幾乎呈現停滯不前的情況,這是因為系統能消耗的電量已達到高峰。

克服晶片效能與功耗挑戰設計架構嶄露頭角

對于未來(lái)任何一種,處理速度都將受限于散熱問(wèn)題而無(wú)法大幅躍進(jìn)。任何裝置一旦達到熱障(ThermalBarrier)就會(huì )開(kāi)始融化,如果是行動(dòng)電話(huà),便會(huì )使裝置溫度上升造成使用者不適。除物理層面的散熱問(wèn)題外,能源效率也會(huì )變得相當差,若調校處理器實(shí)作使其速度加快,則所需耗能便會(huì )倍數增長(cháng),而為增加最后這一丁點(diǎn)的效能,后續導熱設計的成本真的很高。

在過(guò)去,處理器核心面積倍增代表速度倍增,但是現在面積倍增,速度卻只增加幾個(gè)百分點(diǎn),因此復雜度并不代表有效率,這就是單一核心系統有所限制的原因之一。如果無(wú)法加快單一核心速度,就必須增加獨立核心的數量,這也有助于每個(gè)核心去應對其被分配到的任務(wù)需求,有鑒于此,安謀國際()遂于2012年提出big.LITTLE處理器架構(圖1)。

借力大小核設計架構 多核處理器強效又省電

圖1big.LITTLE系統結構示意圖

big.LITTLE主要目的在于解決IC設計業(yè)界眼前最大挑戰,也就是同時(shí)提升晶片效能,并延長(cháng)裝置續航力,以延伸消費者「持續運作,永遠連線(xiàn)」的行動(dòng)體驗。該技術(shù)之所以能達成上述目標,系結合一個(gè)大(big)的高效能處理器核心與一個(gè)小(LITTLE)的低功耗處理器核心,然后根據效能需求,以無(wú)縫連接方式選擇合適的處理器。更重要的是,這種動(dòng)態(tài)分配任務(wù)的動(dòng)作,對于上層應用軟體或中介軟體在處理器上的執行絲毫沒(méi)有任何影響。

目前已應用于市面上行動(dòng)裝置的big.LITTLE設計,結合高效能Cortex-A15多處理器叢集(Cluster)與具有節能特色的Cortex-A7多處理器叢集。這些處理器在架構上百分之百相容,且均支援40位元實(shí)體地址擴展LPAE、虛擬化擴充及NEON、VFP之類(lèi)的運作單元,無(wú)須另外調整即可讓針對其中一種處理器類(lèi)型所編譯的軟體應用程式,順利于另一款處理器上運作。

因應任務(wù)需求處理器核心無(wú)縫切換

big.LITTLE系統結構就快取記憶體一致性(CacheCoherency)的維護而言,無(wú)論是同一處理器叢集中的快取記憶體,或是跨不同處理器叢集的快取記憶體,皆保持快取記憶體資料的一致性。這種跨叢集的一致性來(lái)自CoreLink快取同調匯流架構(CCI-400,也能提供ARMMali-T604之類(lèi)的繪圖處理器(GPU)系統等元件的I/O一致性)。

兩種叢集的中央處理器,還可透過(guò)CoreLinkGIC-400之類(lèi)的共用中斷控制器互傳訊號。其中,系統包含big.LITTLE切換和big.LITTLEMP(Multiple-Processor)兩種執行模式,由于同一應用程式可采用Cortex-A7或Cortex-A15而毋須調整,因此可將應用程式的任務(wù)隨機對應到正確的處理器上。

切換模式是讓不同處理器類(lèi)型在切換時(shí)能進(jìn)行軟體內容的擷取與回覆。以CPU切換來(lái)說(shuō),叢集中每個(gè)CPU在另一個(gè)叢集中都有對應的CPU,而軟體內容則以CPU為單位,隨機在不同的叢集間切換;如果叢集中沒(méi)有正在運轉的CPU,便可關(guān)閉整個(gè)叢集及相關(guān)的L2快取。

同時(shí),此模式也是動(dòng)態(tài)電壓頻率調整(DVFS)等能源/效能管理技術(shù)的延伸。切換動(dòng)作類(lèi)似DVFS操作點(diǎn)的轉換,由于處理器上DVFS曲線(xiàn)的操作點(diǎn),會(huì )隨負載變化不同而來(lái)回變動(dòng),當既有的處理器(或叢集)已達到最高操作點(diǎn),而軟體堆疊仍需更高效能,處理器切換動(dòng)作就會(huì )發(fā)生,改由另一個(gè)處理器執行工作,這個(gè)處理器的操作點(diǎn)也會(huì )隨著(zhù)負載變化不同而來(lái)回變動(dòng)(圖2)。當效能需求不再,可換回之前的處理器(或叢集)。

借力大小核設計架構 多核處理器強效又省電

圖2big.LITTLE切換模式DVFS曲線(xiàn)圖

顯而易見(jiàn),一致性是達到加速切換所需時(shí)間的關(guān)鍵所在,因為它能讓已經(jīng)儲存在離埠處理器(OutboundProcessor)的狀態(tài),在入埠處理器(InboundProcessor)上窺探與回覆,而不必透過(guò)主記憶體的存取。

此外,由于離埠處理器的L2有快取一致性的功能,當任務(wù)切換時(shí),可以透過(guò)窺探資料值的方式,改善入埠處理器的快取暖機時(shí)間,此時(shí)L2快取記憶體仍然可以維持供電狀態(tài);不過(guò),因為離埠處理器的L2快取無(wú)法提供新資料的快取配置,最后還是必須清除并關(guān)閉電源以節省耗電(圖3)。

借力大小核設計架構 多核處理器強效又省電

圖3big.LITTLE運算任務(wù)切換流程圖

由于LITTLE處理器叢集中,每個(gè)處理器都將對應一個(gè)big叢集的處理器,因此CPU乃成對配置(Cortex-A15及Cortex-A7處理器上都有CPU0,Cortex-A15及Cortex-A7處理器上都有CPU1,以此類(lèi)推),不論何時(shí)每個(gè)配對中只有一個(gè)處理器可運轉;而系統則會(huì )主動(dòng)偵測各處理器負載,在高負載時(shí)將內容執行移到大核心(圖4)。當負載從離埠核心移到入埠核心,便會(huì )關(guān)閉其中一個(gè)核心,這種模式讓big與LITTLE核心組合能隨時(shí)運轉。

借力大小核設計架構 多核處理器強效又省電

圖4big.LITTLE系統CPU切換示意圖

[@B]big.LITTLEMP支援非對稱(chēng)叢集運作[@C]big.LITTLEMP支援非對稱(chēng)叢集運作

至于big.LITTLEMP模式則進(jìn)一步將軟體堆疊分配到兩個(gè)叢集中各個(gè)處理器,如此一來(lái),所有CPU皆可同時(shí)運作,將系統效能提升到最高點(diǎn)。

由于big.LITTLE系統可經(jīng)由CCI-400達到快取記憶體的一致性,因此有另一種模式能讓Cortex-A15及Cortex-A7處理器同時(shí)運作并同步執行程式碼,稱(chēng)為big.LITTLEMP,基本上可看作一種異質(zhì)性多工處理模型。這是big.LITTLE系統最先進(jìn)且最具彈性的模式,能跨越兩個(gè)叢集調整單一執行環(huán)境。

在這種使用模式下,若執行緒有上述處理效能方面的需求,便可開(kāi)啟Cortex-A15處理器核心并同時(shí)透過(guò)Cortex-A7處理器核心執行任務(wù)。如果沒(méi)有這方面需求,則只須開(kāi)啟Cortex-A7處理器,在實(shí)際應用上,不同叢集的處理器核心不一定一致,而big.LITTLEMP比較容易支援非對稱(chēng)的叢集。

改善低頻運算多余功耗big.LITTLE備受矚目

big.LITTLE技術(shù)之所以受到IC設計業(yè)者矚目,原因就是一般行動(dòng)工作量對效能的需求各有不同,必須找到最合適的核心處理。圖5顯示的是目前搭載Cortex-A9的行動(dòng)裝置中,兩個(gè)核心在DVFS、閑置與完全關(guān)機狀態(tài)下所花費時(shí)間的百分比,(a)處代表最低頻率操作點(diǎn);(b)處則代表最高頻率操作點(diǎn),介于兩者之間則屬中級頻率。

借力大小核設計架構 多核處理器強效又省電

圖5低密度使用案例的DVFS駐留時(shí)間

除DVFS狀態(tài)之外,作業(yè)系統電源管理也會(huì )使中央處理器閑置,圖中(c)處代表閑置時(shí)間,當CPU閑置的時(shí)間夠長(cháng),系統電源控制軟體將完全關(guān)閉其中一個(gè)核心以節省耗電,圖中(d)處便代表這部分。

從圖5可清楚看出應用程式處理器在好幾種普通工作量下,都有相當多時(shí)間處于低頻率狀態(tài),在big.LITTLE系統里,系統單晶片(SoC)可利用耗能較低的Cortex-A7核心,執行最高操作頻率以外的所有工作。以相同方式分析更為密集的工作量,Cortex-A7處理器對應出低于1GHz頻率的機會(huì )仍然很大。

事實(shí)上,自2011年起,使用者層級軟體已能在big.LITTLE排程上運轉,不過(guò),那只是在處理器核心與互聯(lián)的軟體模型環(huán)境上發(fā)展。為完整評估big.LITTLE系統效能、功耗及調校是否合宜,還須打造一個(gè)能讓使用者軟體全速運轉的測試晶片。

ARM測試晶片早在2012年初夏即由晶圓代工廠(chǎng)完成,并在短短幾周內開(kāi)始搭配參考設計板運轉,支援完整版的Linux系統及Android4.0作業(yè)系統。這個(gè)測試晶片包含一個(gè)雙核心Cortex-A15叢集、一個(gè)三核心Cortex-A7叢集,以及CCI-400快取一致匯流排架構。會(huì )影響部分使用者評效基準的繪圖處理器并不包括在內,但平臺仍可支援Linux、Android作業(yè)系統與效能測試軟體。

測試晶片的Cortex-A15最高頻率達1.2GHz,Cortex-A7則為1GHz。效能評析結果顯示,雖然測試晶片上的記憶體系統效能不如big.LITTLESoC量產(chǎn)后的預測水準,但Cortex-A15與Cortex-A7中央處理器的效能仍落在預期范圍內。

用來(lái)測試big.LITTLE效能的任務(wù)量,主要基于A(yíng)ndroid4.0系統,透過(guò)網(wǎng)頁(yè)進(jìn)行網(wǎng)路瀏覽器效能循環(huán),背景則有音效播放。在此實(shí)例中均以相當密集的工作量搭配對性能需求不高的背景活動(dòng),網(wǎng)路瀏覽器每2秒便進(jìn)行網(wǎng)頁(yè)循環(huán),每頁(yè)卷動(dòng)達500畫(huà)素,因此對系統效能需求相對較高。

這組結論屬于較早期的測試結果,用來(lái)測試初版big.LITTLEMP修正程式組,將Linux排程程式從一個(gè)完整而平衡的排程模式調整成big.LITTLE模式。預期未來(lái)在更多業(yè)者投入軟體修正后,效能與能耗將更進(jìn)一步改善,而其他可調校的部分也將有相關(guān)解決方案被提出。

另外,測試晶片缺少GPU,使CPU的負載高過(guò)搭載GPU系統在卸載狀態(tài)下的負載水準,而在CPU負載較低的狀況下,可能會(huì )較常使用LITTLE核心,進(jìn)而達到節能目的。它包含一套基本的電壓及頻率操作點(diǎn),但沒(méi)有對單一處理器核心做獨立的電源開(kāi)關(guān)設計,因此big.LITTLE系統單晶片量產(chǎn)后測試結果可望提升。舉例來(lái)說(shuō),后臺任務(wù)效能便可節省超過(guò)70%能耗。

IC設計業(yè)者正全力投入big.LITTLE開(kāi)發(fā),然而,各界最常見(jiàn)的疑問(wèn)就是應選擇哪一種軟體模式?目前主要是在CPU切換與big.LITTLEMP之間擇一,而兩種方式各有正反意見(jiàn)。在CPU切換方面,由于big及LITTLE核心處于搭配成對的狀態(tài),因此對稱(chēng)式的拓撲能順暢運作;而big及LITTLE核心數量不同的非對稱(chēng)式拓撲則須額外的運轉。

big.LITTLEMP模式效果更出色

由于Cortex-A7中央處理器核心體積較小,因此可使用四個(gè)LITTLE核心加上一到兩個(gè)big核心,這種作法可能會(huì )具有吸引力。從正面角度來(lái)看,中央處理器切換讓電源及效能的調校更為容易,可重復利用既有的作業(yè)系統電源管理程式碼,代表實(shí)作將有多年的研發(fā)及測試結果做為支援。加上不必調整核心排程程式,范圍比執行big.LITTLEMP模式更為簡(jiǎn)化,而軟體模式也能日趨成熟。

整體而言,CPU切換是一種極佳解決方案,相關(guān)IC設計業(yè)者亦正研擬升級至big.LITTLEMP模式,以提供更多元的處理器運算解決方案。big.LITTLEMP具有多項技術(shù)優(yōu)勢,雖技術(shù)尚未完全成熟,但目前的測試結果已相當不錯。由于此模式也支援非對稱(chēng)式拓撲,故毋須調整軟體即可完全利用系統中所有核心,對提升晶片效能并降低功耗更有利。

舉例來(lái)說(shuō),big.LITTLEMP能同步利用所有核心在短時(shí)間內達到最高效能,或將big與LITTLE核心上的DVFS設定與排程程式設定調成不同狀態(tài),以節省更多電力。不過(guò)彈性提升仍有其代價(jià),晶片商與系統業(yè)者均須增加調校動(dòng)作,才能從big.LITTLEMP平臺獲取完整的效能及能耗優(yōu)勢。

這與過(guò)去一直為主流,由晶片和晶圓代工廠(chǎng)將作業(yè)系統能源管理設定,以及DVFS參數資料,依裝置需求轉化為行動(dòng)系統單晶片平臺的作法并無(wú)太大差異。big.LITTLEMP模式將切換模式延伸并納入新的參數資料,不僅更為節能,更能為經(jīng)過(guò)效能優(yōu)化的big核心增加系統回應度。

big.LITTLEMP模式正快速成熟,已有許多晶片商積極投入開(kāi)發(fā),產(chǎn)品可望在2013下半年大量出爐。由于big.LITTLEMP模式并不須大幅改變硬體,因此晶圓廠(chǎng)可部署支援CPU切換模式的平臺,進(jìn)行核心更新后,再升級到big.LITTLEMP模式,或直接建置現有完整的big.LITTLE平臺。

目前big.LITTLEMP相關(guān)軟體已開(kāi)始運轉,并開(kāi)始在晶片商研發(fā)平臺端進(jìn)行系統測試,ARM與合作夥伴亦正積極進(jìn)行軟體強化,針對各種使用實(shí)例將系統效能調校至最佳效果,包括排程程式的負載平衡政策、上下切換點(diǎn)以及執行緒優(yōu)先秩序等。此外,ARM也在開(kāi)放原始碼平臺每月定期推出big.LITTLEMP修正程式組,內含測試晶片平臺、測試結果以及說(shuō)明文件的最新的調校結果。Linaro也已推出修正程式組和CPU切換軟體,并開(kāi)始供應Linaro聯(lián)盟成員。

隨著(zhù)big.LITTLE技術(shù)演進(jìn),ARM近期更發(fā)布兩款具有big.LITTLE處理性能的新型CPU核心--Cortex-A57及Cortex-A53處理器。Cortex-A57是經(jīng)過(guò)效能優(yōu)化的big核心,每時(shí)脈周期的效能較Cortex-A15增加25%,頻率效能與能源效率也都高于Cortex-A15處理器。Cortex-A53則為L(cháng)ITTLE核心,每時(shí)脈周期效能增加40%,能源效率則等同于Cortex-A7。

布局下世代big.LITTLEARM加速推出新核心

這些新核心在架構上都完全相同,并支援ARMv8架構,因此能導入進(jìn)階版的NEON技術(shù)與浮點(diǎn)功能、加密加速并支援64位元。除AMBA4ACE,兩種核心也都支援新世代快取一致匯流架構,且跟現有ARMv7架構的CPU核心一樣,能在A(yíng)Arch32模式下執行既有程式碼。支援64位元及額外一般用途暫存器的應用方式洗煉而有效率,且能耗增加不多。

微架構也經(jīng)過(guò)強化,以增加各核心在每個(gè)指令時(shí)脈周期中的傳輸量。這些新款核心在經(jīng)過(guò)軟體細部升級并支援64位元定址模式后,將會(huì )跟Cortex-A15及Cortex-A7處理器一樣支援big.LITTLE技術(shù)。

兩種核心將在2013年提供給合作晶圓廠(chǎng),預計2014年開(kāi)始量產(chǎn)。

未來(lái),big.LITTLE設計將為行動(dòng)裝置系統功耗及效能控制點(diǎn)的極度寬動(dòng)態(tài)(WideDynamicRange)帶來(lái)全新的可能性,這是單一類(lèi)型處理器核心所無(wú)法達到的。目前市面上裝置的工作量往往混雜程度高低不同需求的執行緒,這種寬動(dòng)態(tài)便可為其提供完美的執行環(huán)境,提供一個(gè)在新世代行動(dòng)平臺下,提升裝置運算效能并延長(cháng)續航力的大好機會(huì )。



關(guān)鍵詞: big.LITTLE ARM 大小核 處理器

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>