Arm在2018為業(yè)界又帶來(lái)了哪些驚喜?
在踏入互聯(lián)網(wǎng)時(shí)代,尤其是移動(dòng)互聯(lián)網(wǎng)時(shí)代,能夠得到時(shí)代寵幸的公司并不多,其中,Arm算是一個(gè)。
本文引用地址:http://dyxdggzs.com/article/201807/382740.htm而近期,Arm又針對當下應用潮流對于高性能處理器的需求,推出了更高性能的產(chǎn)品序列,包括移動(dòng)領(lǐng)域應用的Cortex-A76,視覺(jué)影像應用的GPU——Mali-G76,以及針對超高清視頻處理器解決方案的Mali-V76。
更高效率的Cortex-A76
新一代Cortex-A76相對于前代(Cortex-A75)而言,同樣采用了于2017年對外發(fā)布的DynamIQ技術(shù)前提下,還采用了先進(jìn)的7nm制程工藝,實(shí)現了35%的性能提升、40%的能效提升和4倍的機器學(xué)習運算能力。
Arm第二次應用到Cortex架構CPU中的DynamIQ技術(shù),其實(shí)是Arm于2017年發(fā)布的在big.LITTLE基礎上演進(jìn)的芯片架構,主要針對現在應用火熱的人工智能及機器學(xué)習方面的能力進(jìn)行了優(yōu)化,因而也被稱(chēng)為DynamIQ big.LITTLE。
相對于先前架構,DynamIQ主要有三方面的突出能力:
1)DynamIQ允許在單一計算集群上進(jìn)行大小核配置,能夠實(shí)現1+3、1+7、3+5等組態(tài)(目前最多可以支持配置8核),因而可配置性提升得以進(jìn)一步提升;
2)DynamIQ可以對每一個(gè)處理器進(jìn)行獨立的頻率控制以及開(kāi)、關(guān)、休眠狀態(tài)的控制,能夠實(shí)現高效、無(wú)縫地在不同任務(wù)間切換合適的處理器;
3)DynamIQ還對內存子系統進(jìn)行了重新設計,可以對內存進(jìn)行更細顆粒度的管理,實(shí)現更快的數據讀取和全新的節能特性。
也因此,應用DynamIQ的CPU更適用于能耗更高、需要快速響應的AI應用。
同時(shí),此次Cortex-A76在延用前代v8.2架構及DynamIQ技術(shù)外,其特點(diǎn)是采用全新的微處理器架構,在微處理器架構方面的改進(jìn)包括提升每周期處理指令數量和更深度的內存層級平行處理。
Arm針對圖像處理應用的GPU開(kāi)發(fā)路線(xiàn)
隨著(zhù)AR/VR、高清手游等對圖像質(zhì)量及圖像渲染能力有高需求的應用領(lǐng)域的興起,專(zhuān)用于圖像處理的GPU也開(kāi)始受到關(guān)注。而Mali系列則是Arm針對這一應用領(lǐng)域開(kāi)發(fā)的GPU。
Arm針對GPU的開(kāi)發(fā)路線(xiàn)可以分為三類(lèi),包括針對成本敏感型的市場(chǎng)的超高效GPU系列UTGARD(出于對成本的考慮,我們可能會(huì )在性能以及提供的功能方面做一些折中去優(yōu)化成本)、擁有最佳的性?xún)r(jià)比的主流GPU產(chǎn)品系列MIDGARD,以及擁有最高性能的高性能GPU系列BIFROST。
此次推出的Mali-G76則是針對高性能應用的GPU,而作為這一代產(chǎn)品的第三個(gè)迭代產(chǎn)品,采用Bifrost繪圖架構及7nm制造工藝,同樣在性能上擁有可觀(guān)的性能提升。
與上一代Mali-G72相比,Mali-G76有30%性能密度、30%的能源效率及2.7倍的機器學(xué)習能力的提升。高能效在帶來(lái)峰值時(shí)的性能高和功耗低同時(shí),也意味著(zhù)更長(cháng)的電池續航時(shí)間。例如一款手機其他配置相同,采用G76GPU玩游戲的時(shí)長(cháng)要高于采用G72GPU的手機。
Mali-V76:8K60幀的解碼性能
Arm是如何設計視頻處理器的呢?
Arm區域市場(chǎng)經(jīng)理王田指出,“首先,我們先指定一個(gè)具有給定性能級別的核心,并針對多個(gè)編解碼視頻標準進(jìn)行優(yōu)化,分析需要支持的視頻標準,并確定哪些功能可以用硬件來(lái)實(shí)現,哪些功能最好放在軟件中實(shí)現。通過(guò)這種方式可以達到更好的軟、硬件協(xié)同的效果。然后,我們有一套硬件模塊來(lái)加速指定的通用功能,并通過(guò)路徑和硬件IP無(wú)縫協(xié)作控制這些功能,執行指定編解碼功能。運行固件時(shí),我們有一套專(zhuān)用的微處理器,提供特定的軟件控制程序,通過(guò)固件提供安卓或者Linux的驅動(dòng),這些都是基于像OpenMAX的集成層,并根據未來(lái)安卓系統的需求可以更新到安卓多媒體的框架?!?/p>
Mali-V76系統解決方案
Mali-V76系統解決方案的硬件支持固定的功能模塊,例如運動(dòng)估計、運動(dòng)補償、比特流處理、區塊濾波器、DMA、MMU引擎等。除了運動(dòng)估計,Mali-V76所有固定硬件加速模塊的吞吐量提升了一倍,同時(shí)還增加了第二組的AXI總線(xiàn),能達到更高的帶寬需求。
在軟件方面,Mali-V76除了支持264、265、VP9等主流視頻標準,還支持10 bit 264編解碼,支持中國廣播電視標準(例如AVS、AVS Plus)。而在軟件框架上,Mali-V76支持內存的分配、多核之間任務(wù)調度以及更好的功耗方面的優(yōu)化。
Mali-V76性能表現
在性能方面,相比于上一代Mali-V61產(chǎn)品相比,Mali-V76支持8K60幀的視頻解碼,速度也是Mali-V61的兩倍;在4K 120幀解碼性能節點(diǎn),在提供同樣解碼能力的同時(shí),有40%的面積節??;在編碼質(zhì)量上,同樣的內容和條件下,有25%的編碼質(zhì)量提升。
Mali-V76在600 GHz運行四核的時(shí),能夠提供每秒4K 12幀的吞吐量。例如在電視墻的應用中,Mali-V76最高可以提供16路(4×4)1080P 60幀解碼性能,或者提供4路4K 60幀的解碼性能。這就為更高畫(huà)質(zhì)VR/AR應用體驗帶來(lái)了可能。
Project Trillium機器學(xué)習平臺
人工智能的興起及智能設備爆發(fā)式增長(cháng)帶來(lái)數據量的急劇增長(cháng),而這就帶來(lái)了本地和云端的兩種數據存儲方式,本地存儲空間有限,而云端存儲又帶來(lái)了成本、安全和速度的問(wèn)題,因而帶來(lái)了邊緣的概念。而邊緣進(jìn)行機器學(xué)習發(fā)展到現在已經(jīng)遠不是一款CPU,甚至不只是CPU自身的問(wèn)題,而是一個(gè)生態(tài)問(wèn)題。Project Trillium則是Arm為了實(shí)現在邊緣的人工智能和機器學(xué)習工作負載于2018年3月推出的開(kāi)發(fā)的平臺。
Project Trillium能夠為開(kāi)發(fā)者提供什么呢?
Project Trillium機器學(xué)習平臺最上層是現在主流的機器學(xué)習的大的體系。Arm機器學(xué)習事業(yè)部技術(shù)總監 Ian Bratt稱(chēng),Arm絕對不是要和機器學(xué)習大的體系去競爭的,相反我們能夠幫助從這些系統的機器學(xué)習工作負載能夠在邊緣成功部署。
中間層是由Arm提供的豐富的開(kāi)源軟件工具和資料庫,所有的這些軟件工具和資料庫的核心和基礎是Arm的演繹推理引擎——Arm NN。
最底層則是Arm硬件處理器方面產(chǎn)品,包括Arm自身的Cortex系列的CPU、Mali系列GPU產(chǎn)品以及Arm專(zhuān)門(mén)針對機器學(xué)習所推出的專(zhuān)用的芯片。
Arm機器學(xué)習專(zhuān)用芯片三大聚焦點(diǎn)
Ian Bratt還介紹了設計機器學(xué)習專(zhuān)用芯片的的三大設計特點(diǎn)。
第一,卷積處理效率的提升。由于現在的機器學(xué)習需要人工處理大量卷積類(lèi)的工作,因而要提高整體ML的處理效率,卷積處理效率的提升是非常關(guān)鍵的一環(huán)。
第二,總體芯片功耗的降低。在芯片上進(jìn)行數據傳輸所消耗的電量遠大于處理每個(gè)比特的數據本身所消耗的電量,因此要降低總體芯片功耗需要實(shí)現更加有效的數據移動(dòng)。
第三,芯片架構的可編程性。人工智能領(lǐng)域本身是一個(gè)全新的領(lǐng)域,神經(jīng)網(wǎng)絡(luò )技術(shù)仍在不斷地變化中,因而芯片架構本身的可編程性也尤為重要。
小結
Arm此次發(fā)布的三款產(chǎn)品更新主要仍然是針對移動(dòng)領(lǐng)域的應用產(chǎn)品,而更高的性能、更低的功耗以及更強大的機器學(xué)習能力是此次產(chǎn)品更新的主要能力提升,同時(shí)也是應對市場(chǎng)上各類(lèi)產(chǎn)品對性能、智能等需要作出的又一次突破。
除了產(chǎn)品更新之外,我們也看到Arm除了原有的生態(tài)之外,還在著(zhù)力擴展自己在人工智能方面的生態(tài)。雖然巨頭廠(chǎng)商不斷追逐,帶有“智能”頭銜的產(chǎn)品也在迭代更新,而其實(shí)真正的智能之路其實(shí)才剛剛開(kāi)始。
評論