<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>
"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > ARM 2023全面運算解決方案與新一代GPU架構 推動(dòng)移動(dòng)運算視覺(jué)體驗升級

ARM 2023全面運算解決方案與新一代GPU架構 推動(dòng)移動(dòng)運算視覺(jué)體驗升級

發(fā)布人:12345zhi 時(shí)間:2023-06-25 來(lái)源:工程師 發(fā)布文章

由左到右分別為:ARM終端產(chǎn)品事業(yè)部產(chǎn)品管理總監Andy Craigen、ARM資深副總裁暨終端產(chǎn)品事業(yè)部總經(jīng)理Chris Bergey、ARM CPU產(chǎn)品管理資深總監Stefan Rosinger。ARM

由左到右分別為:ARM終端產(chǎn)品事業(yè)部產(chǎn)品管理總監Andy Craigen、ARM資深副總裁暨終端產(chǎn)品事業(yè)部總經(jīng)理Chris Bergey、ARM CPU產(chǎn)品管理資深總監Stefan Rosinger。ARM

隨著(zhù)智能手機已成為串流媒體的主要裝置,加上包括AR、3D手游、以及愈來(lái)愈多生成式AI智能技術(shù)的興起,消費者對沉浸式體驗的追求為移動(dòng)運算平臺催生了比以往更高、更復雜的運算需求。為了滿(mǎn)足各式應用需求,ARM日前推出2023全面運算解決方案(TCS23),藉由效能與效率的進(jìn)一步提升,再度突破了ARM運算平臺的能力極限。

全面運算解決方案(Total  Compute  Solutions;TCS)是ARM專(zhuān)為適用于移動(dòng)設備的SoC設計打造的系統級解決方案,其中涵蓋了CPU、GPU硬件IP、互連與系統IP技術(shù),以及軟件和開(kāi)發(fā)工具等。在新發(fā)布的2023全面運算解決方案(TCS23)  中,最主要的亮點(diǎn)包括:推出基于全新第五代GPU架構的旗艦級Immortalis-G720 GPU、效能最強大的ARMv9  Cortex運算叢集系統,以及增強的系統最佳化技術(shù),將持續驅動(dòng)移動(dòng)設備的創(chuàng )新應用。

TCS23是ARM專(zhuān)為適用于移動(dòng)設備SoC設計打造的系統級解決方案。ARM

TCS23是ARM專(zhuān)為適用于移動(dòng)設備SoC設計打造的系統級解決方案。ARM

Cortex-X4可提供比Coretex-X3更佳的效能與效率。。ARM

Cortex-X4可提供比Coretex-X3更佳的效能與效率。。ARM

DSU--120新增了不同的電源模式,可進(jìn)一步降低漏電流。。ARM

DSU--120新增了不同的電源模式,可進(jìn)一步降低漏電流。。ARM

推升數碼體驗 GPU扮演日益重要的角色

ARM專(zhuān)注于GPU開(kāi)發(fā)已有多年時(shí)間,從現今已被廣泛運用的Mali GPU,到2022年首度推出支持硬件光線(xiàn)追蹤技術(shù)的Immortalis-G715旗艦級GPU,把移動(dòng)GPU的效能推升到新的層次。

ARM資深副總裁暨終端產(chǎn)品事業(yè)部總經(jīng)理Chris Bergey表示,對手機設計來(lái)說(shuō),GPU扮演著(zhù)日益關(guān)鍵的角色,不管是提供出色的視覺(jué)體驗與提升機器學(xué)習(ML) 運算,都需要更兼具效能與效率的GPU。

ARM終端產(chǎn)品事業(yè)部產(chǎn)品管理總監Andy   Craigen補充說(shuō),提升繪圖效能對手機設計非常重要,ARM已投入大量資源建構繪圖平臺。大家都知道繪圖功能非常耗能,即使對桌上型電腦和游戲機來(lái)說(shuō)也是如此。所以,ARM的重要任務(wù)是要吸引開(kāi)發(fā)社群,讓他們相信在手機上也能實(shí)現近似在復雜的PC上的視覺(jué)體驗,進(jìn)而愿意將其游戲移植至Android移動(dòng)繪圖平臺。

把光線(xiàn)追蹤技術(shù)導入移動(dòng)設備

Chris Bergey指出,自2022年推出Immortalis-G715以來(lái),不管在效能、功耗、面積(PPA)各方面都獲得了業(yè)界的正面回響,開(kāi)發(fā)社群對于光線(xiàn)追蹤技術(shù)在手機上的應用也展現出高度興趣。

要在手機上實(shí)現真實(shí)3D影像,如何兼顧效能與功耗需求是一大挑戰。Andy   Craigen表示,「由于把PC用的光線(xiàn)追蹤技術(shù)直接搬到移動(dòng)平臺上不可行,因此ARM花了很多時(shí)間分析光線(xiàn)追蹤技術(shù),了解那些功能可帶來(lái)最佳效果,并滿(mǎn)足手機的功耗與芯片面積要求。從2022年首度推出Immortalis-G715以來(lái),我們就展開(kāi)這個(gè)過(guò)程,也將會(huì )持續發(fā)展?!?/p>

在2023年初舉行的GDC大會(huì )上,ARM與聯(lián)發(fā)科技、騰訊游戲共同展示了應用光線(xiàn)追蹤技術(shù)的解決方案。此外,ARM亦積極推動(dòng)生態(tài)系統對此技術(shù)的了解,協(xié)助他們利用各種資源來(lái)開(kāi)發(fā)游戲,包括Unity等游戲引擎的支持就緒,及其免費提供的ARM  Mobile Studio開(kāi)發(fā)工具。

為了展示如何建構光線(xiàn)追蹤技術(shù),ARM臺灣團隊也嘗試自行開(kāi)發(fā)游戲?!肝覀兿M璐苏宫F出Immortalis平臺支持3D繪圖的可行性與出色的視覺(jué)效果,以及如何能在手機的功耗預算內實(shí)現」,Chris Bergey說(shuō)。

推出全新第五代ARM GPU架構

為了進(jìn)一步推升GPU效能,實(shí)現更加沉浸的視覺(jué)體驗,ARM日前宣布推出第五代GPU架構,以及基于此架構的全新Immortalis-G720。這是  ARM 歷來(lái)效能與效率最高的GPU,與前一代產(chǎn)品相比,效能與效率提升了 15%,而面積僅增加2%,同時(shí)存儲器帶寬使用量更大幅降低了40%。

第五代GPU架構的主要特點(diǎn)是導入了延遲頂點(diǎn)著(zhù)色技術(shù) (Deferred Vertex Shading;DVS),透過(guò)重新定義GPU中的數據流,擴展GPU核心數量,最高可達16顆核心,以實(shí)現更高效能。

Chris   Bergey解釋說(shuō),存儲器存取與數據移動(dòng)是影響GPU耗能的主要原因。移動(dòng)繪圖平臺與桌上型電腦的根本差異是在帶寬使用效率。因此,藉由導入DVS技術(shù),能顯著(zhù)降低帶寬使用以及對外部DRAM的存取,提高每秒顯示畫(huà)面張數(幀率),使手機也能支持更復雜的繪圖工作負載。

「游戲只是第五代GPU架構的其中一個(gè)應用市場(chǎng),3D視覺(jué)還可為移動(dòng)設備帶來(lái)更多的應用商機,像是AR、電腦輔助繪圖(CAD)設計等?!?/p>

推動(dòng)AI與機器學(xué)習應用于智能手機上

GPU效能的提升對于增強手機的AI處理能力也至關(guān)重要。Chris   Bergey表示,對移動(dòng)設備來(lái)說(shuō),ARM透過(guò)TCS23提供強大、必要的基本運算架構,而客戶(hù)能自行在其SoC中針對NPU進(jìn)行差異化設計。而ARM也會(huì )透過(guò)與夥伴緊密的合作關(guān)系,持續提供相關(guān)的支持。

他強調,AI需求透過(guò)異質(zhì)運算來(lái)提高運算效能,其中涉及了ML任務(wù)、推論任務(wù)、功耗敏感任務(wù)等不同的運算需求。其設計挑戰在于,需協(xié)助開(kāi)發(fā)人員對AI進(jìn)行最佳的編程,利用最適切的處理器來(lái)執行特定任務(wù)。對ARM來(lái)說(shuō),不只是硬件架構的提升與就緒,也需要提供豐富的軟件、應用程序支持,并協(xié)助客戶(hù)最具效率地把AI編程在通用ARM移動(dòng)運算平臺上,才能真正解決問(wèn)題。

隨著(zhù)近來(lái)生成式AI等全新的智能應用快速興起,ARM亦積極推升手機的AI處理能力,每?jì)赡暝黾右槐?。此外,透過(guò)其開(kāi)源軟件程序庫,不斷提升ARM  IP的機器學(xué)習能力,以便支持開(kāi)發(fā)人員充分運用AI與ML工作負載的優(yōu)勢。Android平臺的Google應用程序已在使用ARM NN與ARM  Compute Library,目前擁有超過(guò)一億的每日活躍用戶(hù),讓開(kāi)發(fā)人員得以運用ARMv9 Cortex-A CPU與ARM  GPU,將其在ML工作負載的執行最佳化。

兼顧效能與效率的Cortex-X4核心

在CPU方面,ARM推出第四代Cortex-X   核心Cortex-X4,這是ARM歷來(lái)速度最快的CPU,與Cortex-X3相比,效能提高了15%,同時(shí),在相同的制程下,與Cortex-X3相比,全新的省電微架構可降低功耗達40%,而面積僅增加10%,是Cortex-X系列中每毫米效能最高的。

ARM  CPU產(chǎn)品管理資深總監Stefan  Rosinger表示,從圖中可以看出,Cortex-X4與Cortex-X3的功耗對應效能曲線(xiàn),明顯地向右移動(dòng)。這意味著(zhù),在相同的效能下,Cortex-X4可比Cortex-X3帶來(lái)顯著(zhù)的功耗減省?;蚴菗Q句話(huà)說(shuō),在相同的功耗下,可提供更高的效能。

「Cortex-X系列核心雖然是基于『效能優(yōu)先   』(performance-first)』的理念來(lái)設計的,但對手機有限的功率預算來(lái)說(shuō),推升效能的同時(shí),仍須兼顧效率,才能為客戶(hù)帶來(lái)真正的價(jià)值。不只功耗,Cortex-X4也提升了面積效率,所以能以相同的面積,提供更高的效能,這是Cortex-X4核心設計上的重要考量?!?/p>

Chris   Bergey補充說(shuō),手機有一定的功率預算,因此必須在兼顧功耗的情況下,來(lái)推升效能。藉由高效率的Cortex-X4,客戶(hù)能夠把相同功耗下帶來(lái)的效能增益,運用在A(yíng)I等其他的更多運算上。另外,此曲線(xiàn)是在iso-process同頻比較條件下的結果,若采用N4或N3制程,取得的效率將更顯著(zhù)。

此外,Cortex-X4可支持2MB的L2快取,最多可擴展至14個(gè)核心叢集,以及32MB的L3快取,可提供絕佳效能與多種彈性配置來(lái)滿(mǎn)足客戶(hù)不同應用市場(chǎng)的需求。除了旗艦級智能手機之外,更高的效能與效率也將能幫助Windows-on-ARM筆記本電腦市場(chǎng)的進(jìn)一步擴展。

系統最佳化技術(shù)實(shí)現強大的運算叢集系統

除了推出新款CPU與GPU之外,TCS23的另一個(gè)重點(diǎn)是提供增強的系統最佳化技術(shù),以提升整體效能。

Chris   Bergey表示,開(kāi)發(fā)GPU時(shí),ARM也把CPU以及系統的運作效能納入考慮。以新推出的Immortalis-G720為例,可與CPU共同使用最高達32MB的系統級快取,根據工作負載來(lái)進(jìn)行最佳配置。目的是使數據都在局部取得,僅量不使用外部DRAM,以降低GPU功耗。

在CPU叢集方面,ARM已將其 DSU(DynamIQ Shared Unit)升級至DSU-120。除了上面提到的14核心擴展性與32MB系統快取之外,另一個(gè)重點(diǎn)是可提供更多不同的電源模式。

Stefan   Rosinger表示,在手機中,會(huì )有Cortex-X、Cortex-A不同的核心,因此可根據不同的工作負載,開(kāi)啟或關(guān)閉特定核心的電源。若以核心電源全開(kāi)啟為基準,可以看到不同使用情境下,電源節省的效益。DSU-120新增的電源模式,可以有效節省芯片的漏電流。

「由于SRAM的微縮腳步跟不上邏輯元件,盡管為了提升效能我們增加了L3快取的容量,但相對的,對功耗也帶來(lái)的新的要求。因此,漏電流的節省也成為不可忽視的議題?!?/p>

展望未來(lái) 邁向異質(zhì)整合時(shí)代

在未來(lái)幾年內,ARM將繼續開(kāi)發(fā)下一代包括Krake GPU和Blackhawk CPU等關(guān)鍵IP,以滿(mǎn)足合作夥伴對于運算與繪圖效能不斷成長(cháng)的要求。

然而,隨著(zhù)芯片即將面臨2納米制程的微縮極限,朝向3D堆疊與先進(jìn)封裝技術(shù)來(lái)延續半導體技術(shù)發(fā)展,已成必然趨勢。對于針對SoC設計者提供IP的ARM來(lái)說(shuō),會(huì )帶來(lái)那些影響與轉變呢?

Chris   Bergey表示,當制程微縮趨近極限時(shí),必須對效能、功耗與面積的權衡有更仔細的考量,才能順應制程推進(jìn),協(xié)助客戶(hù)取得最大效益。隨著(zhù)半導體產(chǎn)業(yè)進(jìn)入3D堆疊與先進(jìn)封裝技術(shù)時(shí)代,就要以系統角度來(lái)思考并區隔設計,為客戶(hù)提供最佳的解決方案,例如把SRAM停留在成熟制程,運算核心采用先進(jìn)制程等。在這過(guò)程中,與臺積電的密切配合至關(guān)重要。藉由深入了解他們的制程技術(shù),才能就此開(kāi)發(fā)出更適切的解決方案。

他指出,采用異質(zhì)整合的先進(jìn)封裝元件未來(lái)也將進(jìn)入移動(dòng)市場(chǎng)。ARM將順應此趨勢,持續在「超越摩爾定律(More than Moore)」時(shí)代勝出。市場(chǎng)對于運算的需求時(shí)無(wú)止境的,而以ARM為基礎的未來(lái)仍將充滿(mǎn)無(wú)限可能性!

*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。



關(guān)鍵詞: ARM GPU

相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>