以協(xié)助因應AI永無(wú)止盡的能源需求為使命
人工智能(AI)擁有超越上個(gè)世紀所有顛覆性創(chuàng )新的潛力,在醫療保健、生產(chǎn)力、教育等許多領(lǐng)域為社會(huì )帶來(lái)的幫助,將超乎我們的想象。為了讓這些復雜的AI工作負載得以運作,全球數據中心所需的運算量也將急速成長(cháng)。然而,這永無(wú)止盡的運算需求反映了一大挑戰:數據中心需要無(wú)比龐大的電力,才能推動(dòng)這項突破性技術(shù)。
當前數據中心的用電量已經(jīng)十分驚人:全球每年需要460太瓦/時(shí)(TWh)的電力,相當于德國全國的用電量。預計在2030年前,AI的崛起將讓這個(gè)數值成長(cháng)3倍,超過(guò)印度這個(gè)全球人口最多國家的總用電量。
未來(lái)的AI模型將持續擴大且更加聰明,進(jìn)而刺激對更多運算的需求,對電力的需求也將隨之增加,形成互相推升的循環(huán)。如何找到降低大型數據中心用電量的方法,對于如何突破社會(huì )發(fā)展與實(shí)踐AI承諾來(lái)說(shuō)相當關(guān)鍵。
換句話(huà)說(shuō),沒(méi)有電力就沒(méi)有AI。
企業(yè)必須重新審視全局以因應能源效率問(wèn)題。
重新構想AI未來(lái):由Arm驅動(dòng)的未來(lái)
追求能源效率是Arm的DNA。Arm最早推出的產(chǎn)品即是運用電池供電,并啟動(dòng)了手機革命。這讓業(yè)界重新思考如何打造芯片,以滿(mǎn)足對AI日益成長(cháng)的需求。
在一個(gè)傳統的服務(wù)器機柜中,光是運算芯片就可消耗超過(guò)50%的電力預算。工程師們正在設法減少這個(gè)數值,每一瓦電力都很重要。
在探尋解方的過(guò)程中,全球最大的AI超大規模運算業(yè)者紛紛改采Arm解決方案來(lái)降低用電量,這并不令人意外。相較于市場(chǎng)上的其他方案,Arm最新的Neoverse CPU是效能最高、能源效率最佳的云端數據中心處理器。Neoverse提供超大規模運算業(yè)者客制化芯片的彈性,將要求嚴苛的工作負載優(yōu)化,同時(shí)提供先進(jìn)的效能和能源效率,省下的每一度電都可以投入更多的運算。這就是現在A(yíng)mazon、Microsoft、Google 和Oracle都采用Arm Neoverse技術(shù),來(lái)處理通用型運算,與進(jìn)行基于 CPU 的 AI 推論和訓練的原因。Arm Neoverse正成為各云端數據中心的實(shí)質(zhì)標準。
請參考近期發(fā)表訊息中的數據:
? AWS基于A(yíng)rm架構的Graviton:相較于市場(chǎng)競品,Amazon Sagemaker的AI推論效能高出25%,Web應用程序效能高出0%,數據庫效能高出40%,能源效率則提升60%。
? Google Cloud基于A(yíng)rm架構的Axion:支持基于CPU的AI推論和訓練、YouTube、Google Earth等服務(wù),相較于競品的傳統式架構,效能高出50%,能源效率提升60%。
? Microsoft Azure基于A(yíng)rm架構的Cobalt:效能比市場(chǎng)競品高出40%,支持 Microsoft Teams等服務(wù),并與Maia加速芯片結合,推動(dòng)Azure的端對端AI架構。
? Oracle Cloud基于A(yíng)rm架構的Ampere Altra Max:相較于傳統的競爭者,每機柜服務(wù)器的效能高出2.5倍,用電量降低2.8倍,并已用于生成式AI推論模型:LLM 訓練的數據匯整、標記,以及批次推論使用場(chǎng)景。
顯然Arm Neoverse已大幅提高云端通用型運算的效能和能源效率。然而,客戶(hù)現在發(fā)現加速運算也能帶來(lái)同樣的效益。大規模AI訓練需要獨特的加速運算架構,例如 NVIDIA Grace Blackwell平臺(GB200),它將NVIDIA的Blackwell GPU架構與基于A(yíng)rm 架構的Grace CPU相結合。相較于使用同級LLM架構的NVIDIA H100 GPU,基于A(yíng)rm 的運算架構可實(shí)現系統級設計的優(yōu)化,將用電量降低25倍,并將每個(gè)GPU的效能提高達30倍。這些優(yōu)化能夠帶來(lái)顛覆性的效能和節能效果,歸功于 Arm Neoverse 能實(shí)現前所未有的客制化芯片的彈性。
隨著(zhù)Arm部署規模的擴大,這些企業(yè)在數據中心總用電量可望節省高達15%。省下的龐大電量,將可用于在相同的功耗范圍內提升AI能力,而無(wú)需增加用電。具體來(lái)看,這些省下的電力可以用來(lái)執行20億次ChatGPT查詢(xún),支持四分之一的日常網(wǎng)絡(luò )搜尋流量,照亮 20% 的美國家庭,或者為類(lèi)似哥斯達黎加面積相仿的國家提供電力。
這對能源消耗和環(huán)境永續產(chǎn)生了驚人的影響。
從基礎面來(lái)看,Arm CPU正在驅動(dòng)AI革命,同時(shí)造福地球。
AI運算的未來(lái)建構于A(yíng)rm之上。
(本文作者Rene Haas為Arm CEO)
評論