三款芯片,英偉達的量身定制
據報道,全球最大的圖形芯片供應商英偉達將在今年第二季度為中國大陸客戶(hù)量產(chǎn)三款精簡(jiǎn)版人工智能(AI)芯片。
本文引用地址:http://dyxdggzs.com/article/202401/455060.htm這家總部位于美國加州的公司原計劃于去年 11 月為中國市場(chǎng)推出三款 AI 芯片——H20、L20 和 L2,但由于該公司希望檢查這些芯片是否符合美國的出口管制,因此推遲到 2024 年推出。
根據加拿大科技新聞網(wǎng)站 Wccftech 發(fā)表的一篇文章,這三款芯片完全符合美國的出口政策,并將在今年第二季度生產(chǎn)。
報告稱(chēng),第一批 H20 芯片可能會(huì )在 2024 年第二季度中后期交付給客戶(hù)。
「在參數方面,H20 的性能密度和計算能力符合美國的出口政策」,一家深圳公司的一位中國作者在周二發(fā)表的一篇文章中說(shuō)。他說(shuō),在 FP8 Tensor Core 操作中,H20 的速度為每秒 296 萬(wàn)億次浮點(diǎn)運算(teraflops 或 tflops),而 H100 為 1979 tflops,H200 為 3958tflops。H200 是世界上最強大的 AI 芯片,比 H20 快 13 倍。
同時(shí),已公布的報道表明,H20 是一臺相對精益求精的機器。Semianalysis 分析師迪倫·帕特爾(Dylan Patel)在去年 11 月發(fā)表的一篇文章中表示,在大型語(yǔ)言模型(LLM)推理方面,H20 實(shí)際上比 H100 快 20% 以上,這可用于使用非常大的數據集生成內容。他說(shuō),雖然 H100 比 H20 快 6.68 倍,但在衡量其性能時(shí),人們還應該考慮 MFU(模型 FLOP 利用率)或實(shí)際利用率。
由于 H100 的 MFU 只有 38.1%,而 H20 可以達到 90%,因此,H20 在實(shí)際多 GPU 互聯(lián)環(huán)境下的性能接近 H100 的 50%。
其他技術(shù)專(zhuān)家表示,H20 在功耗方面具有優(yōu)勢,因為它的熱設計功率為 400 瓦,低于 H100 的 700 瓦。
中國市場(chǎng)
這個(gè)傳奇可以追溯到 2022 年 8 月,當時(shí)拜登政府禁止向中國大陸和俄羅斯出口英偉達的 A100 和 H100,以及 AMD 的 MI250 芯片,因為這些芯片具有很高的互連帶寬——每秒 600 GB 或更高。
針對中國大陸市場(chǎng),英偉達隨后推出了 A800 和 H800 處理器,它們分別以每秒 400 GB 和 300 GB 的速度工作。IT 專(zhuān)家表示,A800 和 H800 的性能分別是 A100 和 H100 的 70% 左右。
2023 年 10 月 17 日,美國商務(wù)部工業(yè)與安全局(BIS)表示,將使用「性能」和「性能密度」作為新參數對受限芯片進(jìn)行分類(lèi)。根據新規定,英偉達的 A800、H800、L40、L40S 和 RTX 4090 芯片被禁止運往中國大陸。英偉達希望通過(guò)將 H20 運往該國來(lái)填補由此產(chǎn)生的空白。
一些分析師表示,如果這款新芯片能夠達到 H100 速度的 50%,而功耗比 H100 低 43%,那么它可能會(huì )對中國客戶(hù)有吸引力。
「雖然 H20 的計算能力低于 H100,但它的價(jià)格會(huì )更低,并且支持英偉達的特殊功能,如 NVLink 和 CUDA 平臺」,總部位于香港的 TF 國際證券集團有限公司的技術(shù)分析師郭明錤說(shuō):「中國客戶(hù)仍然對 H20 芯片有濃厚的興趣?!?/p>
最新特規版顯卡
英偉達于近期發(fā)布了搭載 AD102-250 的中國特規版顯卡,名為 GeForce RTX 4090D,取代限制出口的旗艦產(chǎn)品 GeForce RTX 4090。
2023 年 10 月 17 日美國對中國大陸出口的人工智能相關(guān)芯片、半導體制造設備祭出嚴格限制,導致英偉達高端游戲市場(chǎng)的顯卡 GeForce RTX 4090 在中國大陸銷(xiāo)售受限,為解決這個(gè)問(wèn)題,決定開(kāi)發(fā)定制化的 GeForce RTX 4090 D 顯卡,通過(guò)降低部份規格,以符合美國出口管制要求。
因應美國政府對中國人工智能芯片最新出口管制,RTX 4090 D 需要滿(mǎn)足綜合運算性能(TPP)4800 限制,RTX 4090 無(wú)論 FP8 還是 FP16 的 TPP 都是 5286,比限制值超出 10% 左右。
正常來(lái)說(shuō),英偉達需要在 RTX 4090 基礎上適當削減規格,最直接就是減少 SM、Tensor 和 CUDA 等配置數量,但是,RTX 4090D 要與 RTX 4080 SUPER 之間保持一定的距離。
英偉達表示,將持續完全地遵守美方規定,英偉達確實(shí)提供服務(wù)給在新加坡的中國大陸客戶(hù),包括字節跳動(dòng)、騰訊的國際云端事業(yè)與阿里巴巴集團。申報文件顯示,英偉達對在新加坡的客戶(hù)(包括陸企)銷(xiāo)售額,占整體營(yíng)收約 15%。
RTX 4090 D 和 RTX 4090 都使用臺積電 N4 制程,若獲得美國商務(wù)部核準,將成為英偉達中國市場(chǎng)逆轉勝關(guān)鍵。
相對于中國競爭對手的優(yōu)勢正在縮小
H20 在性能和效率上仍比中國本土 AI 芯片具有優(yōu)勢,但這種優(yōu)勢正在縮小。在政策和財政支持下,許多中國本土芯片廠(chǎng)商正在快速增長(cháng),有朝一日將打破英偉達在人工智能芯片市場(chǎng)的壟斷地位。
事實(shí)上,一些中國大陸科技公司已經(jīng)轉向使用本地芯片。
英偉達面臨的壓力可能會(huì )減弱。2023 年 12 月 2 日,美國商務(wù)部長(cháng)吉娜·雷蒙多(Gina Raimondo)在一個(gè)論壇上表示,如果任何一家美國公司圍繞特定的切割線(xiàn)重新設計其芯片,使中國公司能夠進(jìn)行人工智能,美國政府將在第二天控制它。
不能排除這樣一種可能性,即如果 H20 的表現確實(shí)能達到 H100 的 50%,雷蒙多可能會(huì )進(jìn)一步收緊出口規則。
評論