英偉達GB300回歸Bianca設計
英偉達供應商正加速生產(chǎn)旗艦AI服務(wù)器GB200機柜,此前內部測試發(fā)現軟件錯誤與芯片之間的連線(xiàn)問(wèn)題,目前已解決曾導致出貨延后的技術(shù)問(wèn)題。鴻海、英業(yè)達與緯創(chuàng )在Computex電腦展上表示,GB200機柜已于第一季底開(kāi)始出貨,目前正加速生產(chǎn)。
本文引用地址:http://dyxdggzs.com/article/202505/470970.htm為了加快部署速度,英偉達在GB300的設計方面做了一些妥協(xié)。據供應商透露,舍棄原先規劃導入的Cordelia(多層PCB設計)的新芯片板設計,通知合作伙伴暫時(shí)回歸目前GB200所使用的Bianca(HDI PCB)設計。
Bianca設計是單主板上擁有2顆B300 GPU和1顆Grace CPU;而Cordelia設計則是4顆GPU和2顆Grace CPU,利用SXM插槽接口相連,可讓單顆GPU被獨立更換,能提升客戶(hù)的維護便利性,但是存在信號丟失的問(wèn)題。需要注意的是,英偉達并沒(méi)有放棄Cordelia版設計,已告知供應商計劃在下一代AI芯片中采用重新設計。
今年3月,在美國加州圣何塞會(huì )議中心舉行的GTC 2025大會(huì )上,英偉達創(chuàng )始人兼首席執行官黃仁勛發(fā)布了Blackwell Ultra平臺,帶來(lái)了用于取代B200的B300 GPU,另外還有與Grace CPU相結合的GB300,以及一系列圍繞這些芯片構建的產(chǎn)品線(xiàn)。
據介紹,GB300配備了升級版Blackwell芯片,800GB/s雙向帶寬實(shí)現芯片級“光速互聯(lián)”,推理性能較上代提升1.5倍,HBM內存容量增加了1.5倍,相當于用1/10的硬件成本完成同等規模AI訓練任務(wù)??梢哉f(shuō)GB300是“降維打擊”,以單節點(diǎn)算力碾壓2018年全球頂尖超算Sierra的18000顆GPU集群。
另外,全液冷設計實(shí)現120千瓦/機架極致散熱,較傳統風(fēng)冷方案能耗降低40%,讓單個(gè)機架算力密度突破3倍,數據中心正式進(jìn)入“千瓦級”競賽新紀元。
黃仁勛宣布最新計算平臺GB300將于今年第三季度面世,希望加快整個(gè)Blackwell Ultra平臺的進(jìn)度,以便在今年年底之前實(shí)現全面的量產(chǎn):計劃今年出貨約30000柜的NVL機架,其中大概30%在2025年上半年實(shí)現,其余則是在下半年。值得一提的是,盡管今年GB200服務(wù)器仍會(huì )是主力,但DGX GB300 NVL72還是十分顯眼 —— 單機柜身價(jià)約400萬(wàn)美元,比上一代貴30%。
美銀分析師Vivek Arya上周指出,在禁止英偉達向中國出口A(yíng)I產(chǎn)品H20后,沖擊中國營(yíng)收,將導致最近這一季毛利率從先前預估的71%,降至58%左右。不過(guò),由于英偉達讓機柜重新采用Bianca設計,有助Blackwell加速推出,這可望在下半年協(xié)助抵消中國營(yíng)收所受到的沖擊。
黃仁勛展示GB200、GB300和NVLink Switch
同時(shí),英偉達還攜手全球電腦制造商推出“AI優(yōu)先”的DGX個(gè)人計算系統DGX Station。DGX Station專(zhuān)為最嚴苛的AI工作負載打造,采用GB300 Grace Blackwell Ultra桌面超級芯片,提供高達20 petaflop的AI性能及784GB統一系統內存。
黃仁勛指出,“摩爾定律”因物理限制、芯片成本上升及能源效率的問(wèn)題已宣告終結。英偉達通過(guò)3D芯片封裝、NVLINK技術(shù)及機械與液冷系統,成功重塑AI基礎建設,實(shí)現每6個(gè)月效能翻倍的驚人速度,未來(lái)甚至可能縮短至3個(gè)月翻倍。他強調,英偉達已從GPU芯片公司轉型為AI基礎建設領(lǐng)導者,帶動(dòng)AI產(chǎn)業(yè)從3億美元擴展至數兆美元規模。
評論