英偉達Blackwell芯片存在“發(fā)熱問(wèn)題”,引發(fā)客戶(hù)擔憂(yōu)
英偉達Blackwell芯片曝出發(fā)熱問(wèn)題,需要重新設計機架并可能導致客戶(hù)延誤。
本文引用地址:http://dyxdggzs.com/article/202411/464710.htm據The Information周日報道,英偉達下一代Blackwell處理器安裝在高容量服務(wù)器機架時(shí)面臨著(zhù)過(guò)熱的挑戰。發(fā)熱問(wèn)題導致了設計變更和延遲,并引起了Google、Meta 和Microsoft等客戶(hù)的擔憂(yōu),他們擔心自己是否能按時(shí)部署Blackwell服務(wù)器。
此前,由于芯片出現設計缺陷,英偉達已不得不將Blackwell GPU的生產(chǎn)和交付推遲至少一個(gè)季度。這兩起事件凸顯了英偉達在滿(mǎn)足客戶(hù)對AI硬件的需求方面所面臨的困難。
新的服務(wù)器機架之所以意義重大,是因為其集成了72個(gè)英偉達 AI 芯片,預計每機架功耗高達120kW。由于過(guò)熱會(huì )限制GPU性能并有損壞組件的風(fēng)險,該問(wèn)題導致英偉達多次重新評估其服務(wù)器機架的設計,
針對延遲和過(guò)熱問(wèn)題,英偉達已指示其供應商對機架進(jìn)行幾項設計更改,以解決過(guò)熱問(wèn)題。該公司與供應商和合作伙伴密切合作,開(kāi)發(fā)工程修訂版以改善服務(wù)器冷卻。雖然這些調整對于如此大規模的技術(shù)發(fā)布來(lái)說(shuō)是標準做法,但它們仍然增加了延遲,進(jìn)一步推遲了預期的發(fā)貨日期。
高管們表示,他們至少需要幾周的時(shí)間來(lái)測試系統并解決可能出現的問(wèn)題,尤其是考慮到其新穎的設計和前所未有的復雜性。據一位參與設計的人士稱(chēng),一些客戶(hù)(如微軟)計劃通過(guò)更換一些組件來(lái)定制Blackwell 機架,以適應他們的數據中心。
與此同時(shí),客戶(hù)也在考慮其他選擇。一家訂購了機架的云計算公司的高管表示,Blackwell的問(wèn)題導致該公司考慮購買(mǎi)更多英偉達當前一代 Hopper 芯片。
分析表示,客戶(hù)決定購買(mǎi)更多Hopper芯片,可能會(huì )提高英偉達的短期收益,分析師和投資者估計 Hopper 系列的利潤率更高。但這對英偉達未來(lái)的收入增長(cháng)來(lái)說(shuō)可能不是一個(gè)好兆頭,已經(jīng)轉向 Hopper芯片的客戶(hù)可能不會(huì )訂購那么多Blackwell芯片和NVLink服務(wù)器。
評論