英特爾中國“特供版”AI芯片Gaudi 2 供不應求
9月19日消息,據Digitimes 援引供應鏈人士的話(huà)報道稱(chēng),英特爾面向中國市場(chǎng)推出的“特供版”AI 處理器Gaudi 2 訂單快速增長(cháng),使得英特爾向臺積電大舉追加訂單。
自今年以來(lái),隨著(zhù)以ChatGPT為代表的生成式AI的持續火爆,帶動(dòng)了對于A(yíng)I加速芯片的需求的暴漲,其中英偉達(NVIDIA)A100及H100系列更是成為了搶手貨,特別是在臺積電 CoWos 先進(jìn)封裝產(chǎn)能不足的情況下,英偉達的A100及H100持續短缺,即便是面向中國市場(chǎng)特供的A800 與 H800也是供不應求。
同樣,目前AMD MI300 系列暫未大規模上市,主要也是受制于臺積電的產(chǎn)能。供應鏈人士還透露,Meta、微軟、谷歌、AWS 北美四大云服務(wù)商(CSP)相當期待的 AMD MI300 系列也因為臺積電產(chǎn)能問(wèn)題大受影響。
在此背景之下,能夠在一定程度上替代英偉達AI加速卡的英特爾Gaudi 2自然也受到了市場(chǎng)的追捧。
供應鏈人士稱(chēng),Gaudi 2 訂單能見(jiàn)度已經(jīng)到了 2024 年年中,而下一代采用臺積電 5/4 nm制程的 Gaudi 3 也正在加速上市進(jìn)程,預計 2024 年面世。
資料顯示,Gaudi 2是英特爾在2022年5月發(fā)布的新一代的高性能深度學(xué)習AI訓練處理器,采用7nm制程工藝制造,擁有24個(gè)可編程Tensor處理器核心(TPCs),96GB HBM2e 內存和 24 個(gè) 100GbE 端口。根據英特爾展示的性能對比數據來(lái)看,Habana Gaudi2在RestNet50 Training Throughput和BERT Tralning Throughput等視頻及自然語(yǔ)言處理的模型測試中,性能都達到了NVIDIA A100的2倍左右。
根據第三方機構MLPerf于今年6月發(fā)布的MLCommons MLPerf 基準測試數據顯示,Gaudi 2在GPT-3模型、計算機視覺(jué)模型ResNet-50(使用8個(gè)加速器)、Unet3D(使用8個(gè)加速器),以及自然語(yǔ)言處理模型BERT(使用8個(gè)和64個(gè)加速器)上均取得了優(yōu)異的訓練結果。與市場(chǎng)上其他面向大規模生成式AI和大語(yǔ)言模型的產(chǎn)品相比,Gaudi2擁有卓越的性能與領(lǐng)先的性?xún)r(jià)比優(yōu)勢。比如,在計算機視覺(jué)(ResNet-50)和自然語(yǔ)言處理(BERT微調)方面的表現優(yōu)于英偉達A100,在計算機視覺(jué)方面幾乎與H100不分伯仲。
此外,Gaudi2可為大規模的多模態(tài)和語(yǔ)言模型提供出色的推理性能。在最近的Hugging Face評估中,其在大規模推理方面的表現,包括在運行Stable Diffusion2(另一個(gè)用于從文本生成圖像的最先進(jìn)生成式AI模型之一)、70億以及1760億參數BLOOMz3模型時(shí),在行業(yè)內保持領(lǐng)先。
2023年7月11日,英特爾在北京召開(kāi)發(fā)布會(huì ),正式面向中國市場(chǎng)推出“定制版”的Gaudi 2芯片,可不受美國出口管制限制(應該是將I/O速度限制到了600GB/s以下)。目前,這款芯片已獲得浪潮、新華三、超聚變等服務(wù)器巨頭采用。
編輯:芯智訊-浪客劍
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。