NVIDIA Blackwell平臺發(fā)布,賦能計算新時(shí)代
● 全新Blackwell GPU、NVLink和可靠性技術(shù)賦能萬(wàn)億參數規模的AI模型
● 全新Tensor Core與TensorRT-LLM編譯器將LLM推理運行成本和能耗降低多達25倍
● 全新加速器助推數據處理、工程模擬、電子設計自動(dòng)化、計算機輔助藥物設計和量子計算領(lǐng)域實(shí)現突破
● 各大云提供商、服務(wù)器制造商和頭部AI企業(yè)紛紛采用
NVIDIA于近日宣布推出NVIDIA Blackwell平臺以賦能計算新時(shí)代。該平臺可使世界各地的機構都能夠在萬(wàn)億參數的大語(yǔ)言模型(LLM)上構建和運行實(shí)時(shí)生成式AI,其成本和能耗較上一代產(chǎn)品降低多達25倍。
Blackwell GPU架構搭載六項變革性的加速計算技術(shù),這些技術(shù)將助推數據處理、工程模擬、電子設計自動(dòng)化、計算機輔助藥物設計、量子計算和生成式 AI 等領(lǐng)域實(shí)現突破,這些都是NVIDIA眼中的新興行業(yè)機遇。
NVIDIA創(chuàng )始人兼首席執行官黃仁勛表示: “三十年來(lái),我們一直深耕加速計算領(lǐng)域,力求實(shí)現像深度學(xué)習和 AI 這樣的變革性突破。生成式 AI 是我們這個(gè)時(shí)代的決定性技術(shù),Blackwell GPU 是推動(dòng)新一輪工業(yè)革命的引擎。通過(guò)與全球最具活力的企業(yè)合作,我們將實(shí)現 AI 賦能各行各業(yè)的承諾?!?/p>
許多企業(yè)都在計劃采用 Blackwell,其中包括亞馬遜云科技、戴爾科技、谷歌、Meta、微軟、OpenAI、Oracle、特斯拉和 xAI。
Alphabet和谷歌首席執行官Sundar Pichai表示: “通過(guò)擴展谷歌搜索和Gmail等服務(wù)以服務(wù)于數十億用戶(hù),我們對于如何管理計算基礎設施有了更加深入的了解。隨著(zhù)公司業(yè)務(wù)進(jìn)入AI平臺轉型期,我們將繼續為自身產(chǎn)品和服務(wù)以及云客戶(hù)擴大基礎設施投資。我們有幸與NVIDIA建立了長(cháng)期合作伙伴關(guān)系,并期待著(zhù)將Blackwell GPU的突破性功能帶給我們的云客戶(hù)以及包括Google DeepMind在內的谷歌團隊,以加速未來(lái)的探索進(jìn)程?!?/p>
亞馬遜總裁兼首席執行官Andy Jassy表示: “我們與 NVIDIA 的深度合作可以追溯到 13 年前,當時(shí)我們在 AWS 上推出了全球首個(gè) GPU 云實(shí)例。如今,我們在云端提供了最為廣泛的 GPU 解決方案,以支持全球那些技術(shù)上最先進(jìn)的加速工作負載。正因如此,NVIDIA Blackwell GPU能夠在A(yíng)WS上運行得如此出色,NVIDIA也選擇與AWS共同開(kāi)發(fā)Project Ceiba,將NVIDIA新一代Grace Blackwell超級芯片與AWS Nitro System的高級虛擬化和超快速的Elastic Fabric Adapter 網(wǎng)絡(luò )結合,以用于NVIDIA自身的AI研發(fā)。通過(guò)AWS與NVIDIA工程師的共同努力,我們將持續創(chuàng )新,使AWS成為每一個(gè)想要在云端運行NVIDIA GPU的用戶(hù)的最佳選擇?!?/p>
戴爾科技董事會(huì )主席兼首席執行官Michael Dell表示: “生成式AI對于創(chuàng )建更智能、更可靠和更高效的系統至關(guān)重要。戴爾科技與NVIDIA將攜手塑造未來(lái)科技。隨著(zhù)Blackwell的發(fā)布, 我們將繼續為用戶(hù)提供新一代加速產(chǎn)品和服務(wù),以提供推動(dòng)跨行業(yè)創(chuàng )新所需的工具?!?/p>
谷歌DeepMind聯(lián)合創(chuàng )始人兼首席執行官Demis Hassabis表示:“AI 的變革潛力令人難以置信,它將幫助我們解決世界上那些最重要的科學(xué)問(wèn)題。Blackwell突破性的技術(shù)性能將提供所需的關(guān)鍵算力,從而幫助那些世界上最聰明的大腦繪制新的科學(xué)藍圖?!?/p>
Meta公司創(chuàng )始人兼首席執行官Mark Zuckerberg表示: “從我們的大語(yǔ)言模型到內容推薦、廣告和安全系統,AI 已經(jīng)在賦能一切,而且AI在未來(lái)將會(huì )日益重要。我們期待通過(guò)NVIDIA Blackwell幫助訓練我們的開(kāi)源Llama模型,打造下一代Meta AI和消費產(chǎn)品?!?/p>
微軟執行董事長(cháng)兼首席執行官Satya Nadella表示: “我們致力于為客戶(hù)提供最先進(jìn)的基礎設施,以賦能其 AI 工作負載。一直以來(lái),我們致力于為云端優(yōu)化NVIDIA GPU,通過(guò)在我們的全球數據中心采用 GB200 Grace Blackwell 處理器,我們得以在這一進(jìn)程中再進(jìn)一步,助力世界各地的組織實(shí)現AI落地?!?/p>
OpenAI首席執行官Sam Altman表示: “Blackwell 實(shí)現了巨大的性能飛躍,并將加速我們提供尖端模型的能力。我們很高興能繼續與NVIDIA合作,共同提升AI計算?!?/p>
Oracle董事長(cháng)兼首席技術(shù)官Larry Ellison表示: “Oracle與NVIDIA的緊密合作將推動(dòng)AI、機器學(xué)習和數據分析領(lǐng)域實(shí)現質(zhì)和量的突破。為了讓用戶(hù)能夠獲取更多具有可操作性的洞察,正需要像Blackwell這樣專(zhuān)為加速計算和生成式AI而打造的、更強大的引擎?!?/p>
特斯拉及xAI首席執行官Elon Musk表示:“當下的AI領(lǐng)域,NVIDIA硬件無(wú)可比擬?!?/p>
新架構以紀念David Harold Blackwell命名,他不僅是一位專(zhuān)門(mén)研究博弈論和統計學(xué)的數學(xué)家,也是第一位入選美國國家科學(xué)院的黑人學(xué)者。這一新架構是繼兩年前推出的NVIDIA Hopper?架構以來(lái)的全新架構。
Blackwell的多項創(chuàng )新技術(shù)為加速計算和生成式AI提供助力
憑借六項變革性的技術(shù),Blackwell能夠在擁有高達10萬(wàn)億參數的模型上實(shí)現AI訓練和實(shí)時(shí)LLM推理,這些技術(shù)包括:
● 全球最強大的芯片:Blackwell架構GPU具有2080億個(gè)晶體管,采用專(zhuān)門(mén)定制的雙倍光刻極限尺寸4NP TSMC工藝制造,通過(guò)10 TB/s的片間互聯(lián),將GPU裸片連接成一塊統一的GPU。
● 第二代Transformer引擎:得益于全新微張量縮放支持,以及集成于NVIDIA TensorRT?-LLM 和 NeMo Megatron框架中的NVIDIA先進(jìn)動(dòng)態(tài)范圍管理算法,Blackwell將在新型4位浮點(diǎn)AI推理能力下實(shí)現算力和模型大小翻倍。
● 第五代NVLink:為了提升萬(wàn)億級參數模型和混合專(zhuān)家AI模型的性能,最新一代NVIDIA NVLink?為每塊GPU提供突破性的1.8TB/s雙向吞吐量,確保多達576塊GPU之間的無(wú)縫高速通信,滿(mǎn)足了當今最復雜LLM的需求。
● RAS引擎:采用Blackwell架構的GPU包含一個(gè)用于保障可靠性、可用性和可維護性的專(zhuān)用引擎。此外,Blackwell架構還增加了多項芯片級功能,能夠利用AI預防性維護來(lái)運行診斷并預測可靠性相關(guān)的問(wèn)題。這將最大程度地延長(cháng)系統正常運行時(shí)間,提高大規模AI部署的彈性,使其能夠連續不間斷運行數周乃至數月,同時(shí)降低運營(yíng)成本。
● 安全AI:先進(jìn)的機密計算功能可以在不影響性能的情況下保護AI模型和客戶(hù)數據,并且支持全新本地接口加密協(xié)議,這對于醫療、金融服務(wù)等高度重視隱私問(wèn)題的行業(yè)至關(guān)重要。
● 解壓縮引擎:專(zhuān)用的解壓縮引擎支持最新格式,通過(guò)加速數據庫查詢(xún)提供極其強大的數據分析和數據科學(xué)性能。未來(lái)幾年,每年需要企業(yè)花費數百億美元的數據處理將越來(lái)越多地由GPU加速。
一個(gè)超大規模的超級芯片
NVIDIA GB200 Grace Blackwell超級芯片通過(guò)900GB/s超低功耗的片間互聯(lián),將兩個(gè)NVIDIA B200 Tensor Core GPU與NVIDIA Grace CPU相連。
為了實(shí)現超高的AI性能,搭載GB200的系統可與同在今天發(fā)布的NVIDIA Quantum-X800 InfiniBand和Spectrum?-X800以太網(wǎng)平臺連接。這兩個(gè)平臺均可提供速度高達800Gb/s的高性能網(wǎng)絡(luò )。
GB200是NVIDIA GB200 NVL72的關(guān)鍵組件。NVIDIA GB200 NVL72是一套多節點(diǎn)液冷機架級擴展系統,適用于高度計算密集型的工作負載。它將36個(gè)Grace Blackwell超級芯片組合在一起,其中包含通過(guò)第五代 NVLink 相互連接的72個(gè)Blackwell GPU和36個(gè)Grace CPU。此外,GB200 NVL72還內置NVIDIA BlueField?-3數據處理器,可在超大規模AI云中實(shí)現云網(wǎng)絡(luò )加速、組合式存儲、零信任安全和 GPU 計算彈性。對于LLM 推理工作負載,相較于同樣數量的 NVIDIA H100 Tensor Core GPU,GB200 NVL72最高可提供30倍的性能提升以及多達25倍的成本和能耗降低。
該平臺可作為一個(gè)單GPU,具有1.4 exaflops的AI性能和30TB的快速內存,是組成最新一代DGX SuperPOD的基礎模塊。
NVIDIA提供的HGX B200是一個(gè)通過(guò)NVLink連接8塊B200 GPU的服務(wù)器主板,支持基于x86的生成式AI平臺?;贜VIDIA Quantum-2 InfiniBand和Spectrum-X以太網(wǎng)網(wǎng)絡(luò )平臺,HGX B200支持高達400Gb/s的網(wǎng)絡(luò )速度。
Blackwell的全球合作伙伴網(wǎng)絡(luò )
合作伙伴將從今年晚些時(shí)候開(kāi)始供應采用Blackwell架構的產(chǎn)品。
AWS、Google Cloud、Microsoft Azure、Oracle Cloud Infrastructure將成為首批提供 Blackwell驅動(dòng)實(shí)例的云服務(wù)提供商。同時(shí)NVIDIA云合作伙伴計劃的公司Applied Digital、CoreWeave、Crusoe、IBM Cloud和Lambda也將提供上述服務(wù)。Indosat Ooredoo Hutchinson、Nebius、Nexgen Cloud、Oracle EU Sovereign Cloud、Oracle US, UK, and Australian Government Clouds、Scaleway、新加坡電信、Northern Data Group的Taiga Cloud、Yotta Data Service 的Shakti Cloud和YTL Power International等主權AI云也將提供基于Blackwell架構的云服務(wù)和基礎設施。
GB200還將通過(guò)NVIDIA DGX? Cloud提供,NVIDIA DGX? Cloud是一個(gè)與領(lǐng)先的云服務(wù)提供商共同設計的AI平臺,可為企業(yè)開(kāi)發(fā)人員提供專(zhuān)門(mén)的基礎設施和軟件訪(fǎng)問(wèn)權限,使他們能夠構建并部署先進(jìn)的生成式 AI 模型。AWS、Google Cloud和Oracle Cloud Infrastructure計劃在今年晚些時(shí)候托管采用NVIDIA Grace Blackwell的新實(shí)例。
Cisco、戴爾科技、慧與、聯(lián)想和Supermicro預計將提供基于Blackwell產(chǎn)品打造的各種服務(wù)器。Aivres、永擎電子、華碩、Eviden、Foxconn、技嘉、Inventec、和碩、QCT、Wistron、緯穎和 ZT Systems 也將提供基于Blackwell的服務(wù)器。
此外,越來(lái)越多的軟件制造商網(wǎng)絡(luò ),包括工程仿真領(lǐng)域的全球領(lǐng)導者Ansys、Cadence和Synopsys,將使用基于Blackwell的處理器來(lái)加速其用于設計和仿真電氣、機械和制造系統及零件的軟件。他們的客戶(hù)可以更低成本、更高能效地使用生成式AI和加速計算,來(lái)加速產(chǎn)品上市。
NVIDIA軟件支持
Blackwell 產(chǎn)品組合由生產(chǎn)級AI端到端操作系統NVIDIA AI Enterprise支持。NVIDIA AI Enterprise中包含同日發(fā)布的NVIDIA NIM?推理微服務(wù)以及AI框架、程序庫和工具,企業(yè)可以部署在由NVIDIA提供加速的云、數據中心及工作站上。了解關(guān)于 NVIDIA Blackwell 平臺的更多信息,請觀(guān)看GTC主題演講回放并注冊GTC以參加由NVIDIA和行業(yè)領(lǐng)導者帶來(lái)的會(huì )議。本屆GTC將持續舉辦至3月21日。
評論