GPU芯片,巨變前夜
曾經(jīng),GPU 在 AI 領(lǐng)域炙手可熱,但步入 2025 年,它迅速遭遇了多重嚴峻考驗。
本文引用地址:http://dyxdggzs.com/article/202501/466469.htm在過(guò)去半個(gè)月的時(shí)間里,GPU 領(lǐng)域遭遇了兩大主要挑戰。首先,美國政府出臺了新的禁令措施,對 GPU 的發(fā)展構成了直接限制。其次,ASIC 等定制芯片的迅速崛起,給 GPU 市場(chǎng)帶來(lái)了顯著(zhù)的沖擊與競爭壓力。
接下來(lái),半導體產(chǎn)業(yè)縱橫將深入探討這兩大因素如何具體影響著(zhù) GPU 市場(chǎng)。
挑戰一:美國進(jìn)一步收緊 AI 芯片出口
首先來(lái)看 GPU 面臨的第一個(gè)挑戰。
1 月 13 日晚,拜登政府正式宣布加碼對 AI 芯片及相關(guān)關(guān)鍵技術(shù)的出口管制,限制中國等競爭對手獲取先進(jìn) GPU 的能力。
根據已公布的信息,新規按照受管制程度高低,將世界各國和地區劃分為三大類(lèi)別。日本、英國、韓國和荷蘭、加拿大等 18 個(gè)美國親密盟友和合作伙伴得到豁免,可以自由采購先進(jìn) AI 芯片;新加坡、以色列、沙特阿拉伯、印度、巴西和波蘭等 120 多個(gè)國家和地區,將被施加 AI 芯片出口的配額限制;中國、俄羅斯、伊朗和朝鮮等,則被完全禁止獲取高端 AI 芯片和先進(jìn)的封閉權重模型(Closed-weight models)。
管制新規進(jìn)一步明確,小批量訂單不受配額影響:如果芯片訂單的總算力未超過(guò)大約 1700 個(gè)先進(jìn) GPU,那么就不需要獲取美國的許可,并且不會(huì )計入特定國家或地區進(jìn)口芯片的限額,以使得來(lái)自大學(xué)、醫療機構和研究組織的 AI 芯片訂單可以繼續進(jìn)行。
另?yè)绹虅?wù)部工業(yè)與安全局 (BIS) 官網(wǎng)披露,美國企業(yè)的海外數據中心建設亦將受到限制。新規要求像亞馬遜、微軟、谷歌這樣的云服務(wù)提供商,必須在美國境內部署一半的受管制 AI 芯片;部署在美國親密盟友和合作伙伴之外的受管制芯片規模,則不得超過(guò) 25%;而且,在美國親密盟友和合作伙伴以外的任何單一國家和地區部署的受管制芯片規模,不得超過(guò) 7%。
美國商務(wù)部長(cháng)雷蒙多稱(chēng):「美國當前在 AI 開(kāi)發(fā)和 AI 芯片設計領(lǐng)域處于世界領(lǐng)先地位,維持這種局面至關(guān)重要?!顾€稱(chēng),管制新規無(wú)意切斷世界與 AI 創(chuàng )新的聯(lián)系,而是專(zhuān)門(mén)限制海外最先進(jìn) AI 技術(shù)的發(fā)展。
這份 AI 出口管制新規設置了 120 天的意見(jiàn)征詢(xún)期,并且內容可以修改,意味著(zhù)后續將由特朗普政府最終決定先進(jìn) AI 芯片的出口規則。
眾所周知,美國已多輪出擊,對中國大陸獲取 GPU 芯片實(shí)施管制。這一做法,一方面拖累了中國大陸 AI 能力的發(fā)展進(jìn)程,另一方面,也悄然改寫(xiě)著(zhù) GPU 的市場(chǎng)格局。
受此影響,GPU 市場(chǎng)呈現兩大變化。
GPU 市場(chǎng)的兩大變化
第一點(diǎn),中國大陸本土 GPU 制造能力增強。
近年來(lái),中國國內的許多 GPU 企業(yè)開(kāi)始嶄露頭角。通過(guò)持續的投入和努力,國產(chǎn) GPU 在性能、功能和應用領(lǐng)域等方面都有了提升,逐漸贏(yíng)得了市場(chǎng)的認可和用戶(hù)的信任。國產(chǎn) GPU 不僅在傳統圖形處理領(lǐng)域取得了進(jìn)展,也能夠在人工智能、高性能計算等新興領(lǐng)域展現出一定的競爭力。
主要廠(chǎng)商包括景嘉微、寒武紀、海光信息、天數智芯等。
雖然國產(chǎn) GPU 芯片在技術(shù)上取得了顯著(zhù)進(jìn)步,但與國際巨頭如英偉達相比,仍存在性能差距。
未來(lái)隨著(zhù)計算需求的不斷增長(cháng)和算法的不斷優(yōu)化,國產(chǎn) GPU 芯片需要不斷提升其性能以滿(mǎn)足更廣泛的應用場(chǎng)景。通過(guò)加大研發(fā)投入,引入更先進(jìn)的制造工藝和設計理念,國產(chǎn) GPU 芯片有望在未來(lái)實(shí)現技術(shù)突破。
第二點(diǎn),英偉達等 GPU 行業(yè)龍頭的出貨能力受到拖累。
早在 2022 年 10 月、2023 年 10 月,美國商務(wù)部工業(yè)和安全局(BIS)兩次更新對中國的先進(jìn)半導體和計算設備的出口管制,英偉達中國特供版 GPU 產(chǎn)品 A800、H800 芯片均已受到管制。與此同時(shí),AMD 發(fā)布的性能最強的 MI300X、MI300A、MI250X、MI250 等多款 AI 芯片也不再能出口到中國了。
美國的出口管制政策使得英偉達無(wú)法向中國市場(chǎng)提供最先進(jìn)、性能最強的 GPU 產(chǎn)品,這限制了其在華業(yè)務(wù)的拓展,特別是在人工智能、云計算等對高性能 GPU 需求旺盛的領(lǐng)域。中國作為全球最大的半導體市場(chǎng)之一,失去了這部分市場(chǎng)份額,對英偉達的營(yíng)收增長(cháng)帶來(lái)了一定壓力。
盡管英偉達之后試圖通過(guò)推出一些替代產(chǎn)品來(lái)維持在中國市場(chǎng)的份額,如 HGX H20 GPU,但整體出貨能力仍受到較大影響。
同時(shí),這也可能引發(fā)全球 GPU 市場(chǎng)格局的調整,其他國際競爭對手可能會(huì )趁機搶占英偉達和 AMD 在中國市場(chǎng)留下的空白,進(jìn)一步加劇全球 GPU 市場(chǎng)的競爭態(tài)勢。
AI 芯片出口管制新規的發(fā)布也引發(fā)了英偉達的批評。
英偉達政府事務(wù)副總裁 Ned Finkle 在 1 月 13 日一篇博文中指出,基于美國的技術(shù),AI 得以在世界各地廣泛應用,推動(dòng)了國內外各行各業(yè)的進(jìn)步與發(fā)展。但拜登政府試圖推行的「人工智能擴散」(AI Diffusion)規則,是前所未有和具有誤導性的,這可能會(huì )破壞全球創(chuàng )新和經(jīng)濟增長(cháng)。
Ned Finkle 批評稱(chēng),管制新規不會(huì )緩解任何威脅,只會(huì )削弱美國的全球競爭力,動(dòng)搖那種使美國保持領(lǐng)先的創(chuàng )新能力。
挑戰二:定制芯片 ASIC 的興起,沖擊 GPU
年初,一股 ASIC 熱席卷全球。
ASIC 熱潮興起的原因主要有三點(diǎn):
其一,GPU 已成為 AI 芯片領(lǐng)域競爭的核心焦點(diǎn)。目前,英偉達所產(chǎn)出的 GPU 主要被各大科技巨頭所壟斷。
第二點(diǎn),GPU 價(jià)格的飆升使得這些科技巨頭在采購芯片時(shí)需要支付更高的成本。
第三點(diǎn),從另一角度來(lái)看,即便科技巨頭暫且將成本因素置于次要地位,英偉達本身的供應不足狀況仍使這些科技巨頭憂(yōu)心不已。
彼時(shí)尋找價(jià)格更為親民、供應更具穩定性且能滿(mǎn)足自身 AI 運算需求的芯片,成為了眾多科技巨頭的當務(wù)之急,而 ASIC 芯片的出現,恰到好處地契合了這些需求。
ASIC 熱潮突如其來(lái),追根溯源,去年 12 月是關(guān)鍵轉折點(diǎn)。彼時(shí),作為 ASIC 領(lǐng)域極為重要的概念股,博通的股價(jià)強勢上揚,從 180 美元一路飆升至 250 美元,市值一舉突破萬(wàn)億美元大關(guān)。與之形成鮮明對比的是,英偉達風(fēng)光不再,股價(jià)一路下行,甚至跌破 130 美元。
Google 公司大名鼎鼎的 TPU(Tensor Processing Unit,張量處理單元),還有前幾年很火的比特幣礦機,英特爾的 Gaudi 2 ASIC 芯片,IBM 的 AIU,AWS 的 Trainium,都屬于 ASIC 芯片。此外,這幾年非?;鸬?nbsp;DPU(Data Processing Unit,數據處理單元)和 NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò )處理單元),也是 ASIC 芯片。
倘若一定要知道兩者各自有哪些優(yōu)勢,本文將在這里將 ASIC 與 GPU 做一個(gè)詳細對比。
ASIC 專(zhuān)為特定 AI 算法定制,在執行特定任務(wù)時(shí)性能卓越,像 Google 的 TPU 針對深度學(xué)習矩陣運算優(yōu)化,計算效率極高。它能效比出色,能降低能耗成本,且大規模處理數據時(shí)吞吐量高、延遲低。大規模使用時(shí),其單位算力成本遠低于 GPU,如谷歌的 TPUv5、亞馬遜的 Trainium2 單位算力成本僅為英偉達 H100 的 70% 和 60%。不過(guò),ASIC 靈活性差,功能固定,算法改變就需重新設計,開(kāi)發(fā)難度大,軟件生態(tài)單一。
GPU 通用性強,能應對多種計算任務(wù),在科學(xué)計算、游戲渲染等領(lǐng)域廣泛應用。其并行計算能力強大,適合處理復雜神經(jīng)網(wǎng)絡(luò )模型。而且,它擁有成熟豐富的軟件生態(tài),借助 CUDA 等,開(kāi)發(fā)者易于上手。然而,GPU 在特定任務(wù)上效率遜于 ASIC,功耗較高,會(huì )增加能耗成本。高端 GPU 價(jià)格高昂,如英偉達 H100 售價(jià) 2.5 萬(wàn)至 3 萬(wàn)美元,獲取難度大,且存在時(shí)延較高的問(wèn)題。
GPU,會(huì )迎來(lái)淘汰嗎?
那么有了 ASIC,會(huì )很快就淘汰 GPU 嗎?
筆者認為,非也。
綜合多家第三方機構的統計可見(jiàn),在 GPU 市場(chǎng),英偉達目前占據了大約 90% 份額,AMD 雖然也在積極發(fā)布 GPU 產(chǎn)品,但因為在軟件生態(tài)建設方面不夠完善,到目前為止僅個(gè)位數百分比市場(chǎng)份額。
憑借性能、生態(tài)、集成能力等方面的優(yōu)勢,英偉達的 GPU 仍然會(huì )是中短期內的 AI 芯片首選。英偉達的軟硬件網(wǎng)絡(luò )整套方案都很成熟,技術(shù)和資金實(shí)力太強,GPU 的存量和出貨量依然很大,市場(chǎng)地位難以撼動(dòng)。
ASIC 的崛起速度雖然很快,但仍需要一定的時(shí)間走向成熟。AI ASIC 芯片的研發(fā),也具有很高的風(fēng)險。即使研發(fā)成功,也需要時(shí)間被用戶(hù)所接受。
這就意味著(zhù),在很長(cháng)的一段時(shí)間內,GPU 和 ASIC 都將處于共存狀態(tài)?;诓煌膱?chǎng)景,用戶(hù)會(huì )選擇最適合自己的芯片。發(fā)展自研 ASIC,更多是有利于廠(chǎng)商們和英偉達進(jìn)行談判砍價(jià)。
AMD 首席執行官蘇姿豐也曾對這一問(wèn)題發(fā)表過(guò)觀(guān)點(diǎn),蘇姿豐表示:「目前,GPU 是大語(yǔ)言模型的首選架構,因為 GPU 在并行處理方面非常高效,但在可編程性方面有所欠缺。五年多后它還會(huì )是首選架構嗎? 我認為情況會(huì )發(fā)生變化?!?/p>
蘇姿豐預計,五年或七年時(shí)間內 GPU 還不會(huì )失勢,但會(huì )出現 GPU 以外的新勢力。
如此來(lái)看 ASIC 或許會(huì )是最優(yōu)選之一。在未來(lái)一段時(shí)間內,ASIC 芯片將處于快速發(fā)展階段,摩根士丹利預計,AI ASIC 市場(chǎng)規模將從 2024 年的 120 億美元增長(cháng)至 2027 年的 300 億美元,年復合增長(cháng)率達到 34%。
當然,除了 ASIC 之外,像 FPGA 等其他類(lèi)型的 AI 芯片也可能嶄露頭角,共同改變未來(lái) AI 芯片的市場(chǎng)格局。GPU 雖然當前在 AI 領(lǐng)域占據重要地位,但隨著(zhù)技術(shù)的不斷革新,其面臨的挑戰日益嚴峻,未來(lái)的 AI 芯片架構領(lǐng)域將充滿(mǎn)更多變數與可能性。
評論