英特爾披露5nm“中國特供版”AI 芯片,性能或暴降92%,最快6月推出
關(guān)于英特爾Gaudi 3的“中國特供版” AI 芯片有了新進(jìn)展。
本文引用地址:http://dyxdggzs.com/article/202404/457599.htm4月15日消息,芯片巨頭英特爾(Intel)日前在官網(wǎng)發(fā)布一份24頁(yè)的“Gaudi 3 AI加速器白皮書(shū)”中披露,英特爾將推出Gaudi 3在中國發(fā)售的兩款“特供版”AI 芯片產(chǎn)品。
英特爾Gaudi 3 AI芯片(圖片來(lái)源:Intel官網(wǎng))
具體包括兩種硬件形態(tài)加速卡:一款型號為HL-328的OAM兼容夾層卡(Mezzanine Card),預計將于今年6月24日推出;另一款是型號為HL-388的PCle加速卡,預計將于今年9月24日推出。而基于內核數量、工作頻率、TDP等參數估算,相比Gaudi 3國際版,“中國特供版”HL-328芯片性能或降低約92%左右。
早前4月9日舉行的美國Intel Vision 2024會(huì )議上,英特爾發(fā)布新一代Gaudi 3 AI 加速芯片,采用臺積電5nm工藝,帶來(lái)4倍(400%)的BF16 AI計算能力提升。同時(shí),相比英偉達H100 GPU,英特爾Gaudi 3 AI芯片的模型訓練速度提升40%,推理速度提升50%,平均性能提高 50%,能效平均提高40%,但成本卻僅為H100的一小部分。
對于Gaudi 3中國特供版消息,鈦媒體App已向英特爾美國總部發(fā)送郵件詢(xún)問(wèn)更多詳細信息,但截至發(fā)稿前,英特爾方面并未回復。
據悉,過(guò)去一段時(shí)間,美國政府不斷升級對華半導體、AI 芯片等領(lǐng)域的出口管制。
2022年8月9日,美國總統拜登簽署總額高達2800億美元的《芯片和科學(xué)法案》(以下簡(jiǎn)稱(chēng)“芯片法案”),通過(guò)527億美元的巨額產(chǎn)業(yè)補貼和遏制競爭的條款,推動(dòng)芯片制造“回流”美國本土。該法案禁止獲得補貼的美國及其盟友伙伴的企業(yè)10年內在中國和其他關(guān)切的國家新建或擴大先進(jìn)制程芯片廠(chǎng)。
2022年10月7日、2023年10月17日,美國商務(wù)部工業(yè)和安全局(BIS)連續兩次發(fā)布對中國的先進(jìn)半導體和計算設備的出口管制,旨在阻止中國進(jìn)口 AI 半導體產(chǎn)品。同時(shí),英偉達、AMD、英特爾的多款GPU和 AI 芯片產(chǎn)品已不能再出口到中國,就連高端游戲顯卡RTX 4090都受到了限制。
2023年12月,美國商務(wù)部BIS宣布啟動(dòng)對成熟制程節點(diǎn)的半導體供應鏈展開(kāi)調查,劍指中國芯片半導體產(chǎn)業(yè)。
2024年3月29日,BIS更新出口限制措施,其中包括美國對中國出口的 AI 半導體產(chǎn)品將采取“逐案審查”(case-by-case review)政策規則,包括技術(shù)級別、客戶(hù)身份、合規計劃等信息全面查驗,以及部分 AI PC 芯片或納入到出口管制措施當中,更大范圍限制英偉達、AMD等先進(jìn) AI 芯片和半導體設備向中國銷(xiāo)售,4月4日全面生效。
4月11日,美國商務(wù)部在“聯(lián)合公報”(Federal Register)上更新了最新的實(shí)體清單(Entity List),將6家中國企業(yè)列入“實(shí)體清單”,其中包括英偉達在中國的最大 AI 芯片經(jīng)銷(xiāo)商思騰合力(天津)科技有限公司(SITONHOLY (Tianjin) Co., Ltd.)。
事實(shí)上,在美國B(niǎo)IS第一輪出口管制下,早在2023年7月,英特爾就曾發(fā)布基于7nm制程的“中國特供版”AI芯片Gaudi2。相比國際版Gaudi2,面向中國市場(chǎng)推出的加速卡在性能上差別不大,而集成以太網(wǎng)RDMA端口數量從24個(gè)端口減到21個(gè),以符合美國芯片出口管制規定。(詳見(jiàn)鈦媒體App前文:《英特爾發(fā)布中國特供版7nm AI芯片Gaudi2,減少RDMA接口以符合出口管制規定》)
然而,鈦媒體App了解到,英特爾Gaudi 2中國特供版僅銷(xiāo)售幾十張OAM產(chǎn)品。自去年BIS 1017新規更新后,由于英特爾Gaudi 2“中國特供版”產(chǎn)品性能高于出口管制措施,最終導致其產(chǎn)品再也沒(méi)能繼續銷(xiāo)往中國市場(chǎng)。
基于此,去年12月前后,英特爾曾嘗試研發(fā)Gaudi 2 HL-225B變體,內部稱(chēng)Gaudi 2C AI芯片,希望重新獲得銷(xiāo)往中國大陸的許可,但最后卻等到今年3月BIS公布更新出口限制措施。
4月10日發(fā)布Gaudi 3之后,英特爾重新研發(fā)特供版產(chǎn)品,希望讓5nm Gaudi 3 AI芯片未來(lái)全力爭奪中國市場(chǎng),旨在為 AI 和云客戶(hù)提供英偉達產(chǎn)品的“替代選擇”。
具體硬件規格方面,中國特供版的Gaudi 3 與原版相比,具有相同的96MB SRAM片上內存, 128GB HBM2e高帶寬內存,帶寬為 3.7TB/s,擁有PCIe 5.0 x16 接口和解碼標準。但是,由于美國對于A(yíng)I芯片的出口管制規則限制,使得這類(lèi)高性能AI的綜合運算性能(TPP)需要低于4800才能出口到中國, 這意味中國特供版的Gaudi 3 的16bit性能不能超過(guò)150 TFLOPS。
相比Gaudi 3 國際版達到的1835 TFLOPS(FP16/BF16),中國特供版Gaudi 3 需要大幅削減內核數量和工作頻率,最終可能需要其AI性能降低約92%,才能符合美國的出口管制要求。
同時(shí),由于中國特供版Gaudi 3產(chǎn)品的AI性能降低,這也將使得其TDP(熱設計功耗)大幅降低,預計OAM卡和PCIe卡的TDP均為450瓦,而原版PCIe卡(HL-338)的TDP高達600瓦,原版OAM卡(HL-325L、HL-335)的TDP更是高達900瓦。
整體來(lái)說(shuō),英特爾專(zhuān)為中國市場(chǎng)推出的“特供版”Gaudi 3兩款產(chǎn)品的 AI 性能,或將與英偉達“中國特供版”AI 加速卡H20水平相當,后者比H100的整體性能降低80%左右,達148 TFLOPS的FP16/BF16性能,略低于出口管制的150 TFLOPS的限制。
目前,英偉達H20 AI芯片已經(jīng)向中國大陸客戶(hù)送樣,但國內百度、阿里等 AI 龍頭對其反響平平。有行業(yè)人士對鈦媒體App表示,主要原因是H20性能太低、價(jià)格太高,企業(yè)購買(mǎi)意愿降低了。
美國商務(wù)部長(cháng)雷蒙多(Gina Raimondo)早前在一場(chǎng)公開(kāi)論壇中表示,美國絕不能讓中國得到這些最尖端的芯片,絕不能讓中國芯片技術(shù)趕超美國。美國政府不允許英偉達向中國出售“最復雜、處理能力最高”的 AI 芯片,以防中國有能力訓練前沿 AI 模型。
此外,有消息稱(chēng),美國政府還正在制定一份禁止接收關(guān)鍵工具的中國先進(jìn)芯片制造工廠(chǎng)名單,以便美國企業(yè)更容易阻止技術(shù)流入中國,這份名單可能會(huì )在未來(lái)幾個(gè)月內公布。同時(shí),美國正向包括荷蘭、日本、德國和韓國在內的盟友施壓加碼,要求它們進(jìn)一步收緊對中國獲得半導體技術(shù)的限制措施。
針對于美方行動(dòng),外交部發(fā)言人毛寧在4月11日表示,“我們堅決反對美方濫用實(shí)體清單等出口管制工具遏制打壓中國企業(yè),敦促美方停止將經(jīng)貿科技問(wèn)題政治化、工具化、武器化。中方將采取必要措施堅決維護中國企業(yè)的合法權益?!?/p>
評論