英偉達發(fā)布最強AI超算:4608個(gè)H100 GPU

英偉達周四發(fā)布了一段視頻,首次向公眾展示了其最新的面向企業(yè)的超級計算機Eos的架構,Eos是專(zhuān)為數據中心規模的高級人工智能開(kāi)發(fā)而設計的,也是該公司速度最快的人工智能超級計算機。
Eos 機器目前由 Nvidia 自己使用,在最新的 Top 500 榜單中,它被評為世界上性能最高的超級計算機的第 9 位,該榜單以 FP64 為衡量標準;在純 AI 任務(wù)中,它很可能是速度最快的超級計算機之一。同時(shí),它的藍圖也可用于為其他公司建造面向企業(yè)的超級計算機。
"Nvidia在視頻中表示:"每天,EOS都在迎接Nvidia數千名從事人工智能研究的內部開(kāi)發(fā)人員的挑戰,幫助他們解決以前無(wú)法解決的問(wèn)題。
Nvidia的Eos配備了576個(gè)DGX H100系統,每個(gè)系統包含8個(gè)Nvidia H100 GPU,用于人工智能(AI)和高性能計算(HPC)工作負載。該系統總共裝有1,152個(gè)英特爾至強Platinum 8480C(每個(gè)CPU有56個(gè)內核)處理器和4,608個(gè)H100 GPU,使Eos在HPC和AI方面分別達到了Rmax 121.4 FP64 PetaFLOPS和18.4 FP8 ExaFLOPS性能。
Eos(依托于DGX SuperPOD架構)的設計專(zhuān)為人工智能工作負載和可擴展性而打造,因此它采用了Nvidia的Mellanox Quantum-2 InfiniBand with In-Network Computing技術(shù),該技術(shù)的數據傳輸速度高達400 Gb/s,這對于有效訓練大型人工智能模型和擴大規模至關(guān)重要。
除了強大的硬件,Nvidia 的 Eos 還配備了強大的軟件,該公司表示,這些軟件也是專(zhuān)為人工智能開(kāi)發(fā)和部署而設計的。因此,Nvidia 的 Eos 可以應對從類(lèi)似 ChatGPT 的生成式人工智能到人工智能工廠(chǎng)等各種應用。
"Eos擁有一個(gè)集成的軟件棧,其中包括AI開(kāi)發(fā)和部署軟件,包括協(xié)調和集群管理、加速計算存儲和網(wǎng)絡(luò )庫,以及針對AI工作負載優(yōu)化的操作系統,"Nvidia在視頻中說(shuō)。"Eos是Nvidia DGX超級計算機(如Saturn 5和Selene)知識的結晶,是Nvidia人工智能專(zhuān)業(yè)技術(shù)的最新實(shí)例。通過(guò)創(chuàng )建像Eos這樣的人工智能工廠(chǎng),企業(yè)可以承擔他們最苛刻的項目,并在今天和未來(lái)實(shí)現他們的人工智能愿望。"
我們不知道 Eos 的成本是多少,而且 Nvidia DGX H100 系統的定價(jià)是保密的,取決于很多因素,比如數量,這也無(wú)濟于事。與此同時(shí),考慮到每臺 Nvidia H100 的成本可能在 3 萬(wàn)至 4 萬(wàn)美元之間,這取決于數量,因此我們可以大致估測出其有多昂貴。來(lái)源:芯榜
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。