AMD GPU,迎來(lái)歷史性時(shí)刻
時(shí)機是一件有趣的事情。2006 年夏天,AMD 以 56 億美元收購了 GPU 制造商 ATI Technologies,并在 CPU 領(lǐng)域與英特爾展開(kāi)競爭,在 GPU 領(lǐng)域與 Nvidia 展開(kāi)競爭,同年夏天,研究人員首次開(kāi)始研究如何將單精度浮點(diǎn)數學(xué)運算從 CPU 卸載到 Nvidia GPU嘗試加速 HPC 仿真和建模工作負載。
這個(gè)時(shí)機很偶然,它讓 AMD 走上了第二種形式的數據中心計算之路,老實(shí)說(shuō),這對該公司來(lái)說(shuō)一直是難以捉摸的,因為在封存 Opteron 服務(wù)器后,它在服務(wù)器 CPU 業(yè)務(wù)上有如此大的混亂需要清理。收購 ATI 幾年后推出 CPU 產(chǎn)品線(xiàn)。
然而,在 Lisa Su 的指導下,AMD 并沒(méi)有取消 Epyc 系列的服務(wù)器 CPU 業(yè)務(wù),該業(yè)務(wù)目前正在銷(xiāo)售第四代芯片,盡管服務(wù)器出現了普通的衰退(部分原因是需要花費巨額資金),但該業(yè)務(wù)的表現仍然相當不錯在人工智能服務(wù)器上投入了大量資金——但它一直在斷斷續續地整合一系列可靠的 Instinct GPU,其架構與 Radeon 客戶(hù)端 GPU 不同,可以在數據中心與 Nvidia 抗衡,并阻止大量初創(chuàng )公司兜售針對人工智能、有時(shí)是高性能計算和分析的矩陣數學(xué)引擎。
曾經(jīng)被稱(chēng)為 Radeon Instinct 系列的崛起需要時(shí)間,而且可能比 AMD 想象的還要長(cháng)。漫長(cháng)的旅程始于“Graphics Core Next”架構,該架構與“Vega 10”Radeon 和 Radeon Instinct MI25 GPU一起首次亮相,這些 GPU 于 2018 年夏天推出,當時(shí) Nvidia 在 2018 年占據了前百億億次系統交易的很大一部分。
五年前,GPU 上的機器學(xué)習已經(jīng)超越了人類(lèi)的圖像識別能力,并且創(chuàng )建了模型來(lái)從速度到文本或圖像到文本以及口語(yǔ)和書(shū)面語(yǔ)言之間的轉換。此時(shí),在數據中心的 GPU 計算方面,AMD 對 Nvidia 的威脅并不大,而 Nvidia 正準備推出自己的 CPU,以在這方面對英特爾和 AMD 構成威脅。

通過(guò)在 2018 年 SC18 超級計算大會(huì )之前推出的“Navi”Vega 20 GPU(用于 Instinct MI50 和 MI60 GPU 加速器),AMD 證明了它可以組裝出可靠的 GPU,但我們從未真正看到過(guò)高端MI60 上市后,盡管這些設備提供了相當不錯的性?xún)r(jià)比,但與 Nvidia CUDA 堆棧和庫相比,Radeon Open eCosystem (ROCm) 軟件堆棧還是一個(gè)玩具,而 Nvidia CUDA 堆棧和庫當時(shí)已經(jīng)發(fā)展了十年。
我們確實(shí)將 Vega 10 和 Vega 20 視為一項工作,有點(diǎn)跨越了幾年,只是真正為 AMD 提供了一個(gè)開(kāi)始真正 GPU 工作的基線(xiàn)。
通過(guò)在 SC20 上發(fā)布的“Arcturus”GPU,我們表示 AMD 正處于一個(gè)轉折點(diǎn),其 Instinct MI100 GPU使用了這款非常受人尊敬的 GPU 以及不斷發(fā)展的 ROCm 堆棧,我們堅持這一評估。一年后,在 SC21 之前,AMD 推出了“Aldebaran”GPU,它或多或少在一個(gè)封裝中包含兩個(gè) Arcturus 單元,這是部署在“Instinct MI250X 加速器”中的核心 GPU。橡樹(shù)嶺國家實(shí)驗室的 Frontier”超級計算機打破了百億億次計算障礙。(是的,這肯定是一個(gè)障礙。)
憑借“Antares”Instinct MI300系列,這是AMD數據中心GPU業(yè)務(wù)的第三次魅力,該公司正在準備擁有一個(gè)重要的GPU業(yè)務(wù),該公司在完成第三季度財務(wù)報告時(shí)終于公布了一些數據結果。Antares 加速器的 MI300A 變體是一種混合設備,CPU 和 GPU 電機共享 128 GB HBM3 內存塊,是目前安裝在勞倫斯利弗莫爾國家實(shí)驗室的“El Capitan”超級計算機的核心。El Capitan 預計將提供超過(guò) 2 exaflops 的總峰值 FP64 浮點(diǎn)性能,這將使其成為地球上最快的機器——至少在一段時(shí)間內是這樣。Instinct MI300X 加速器是一款全 GPU 設備,配備 192 GB HBM3 內存,將推動(dòng)超大規模數據中心和云構建商的銷(xiāo)售,而且看起來(lái)將在 2024 年第一季度出現大幅增長(cháng)。
AMD 將于 12 月 6 日在圣何塞推出 MI300 系列 GPU,但它無(wú)法抑制自己的熱情,因為看起來(lái)它將從數據中心 GPU 銷(xiāo)售中獲得實(shí)質(zhì)性且可持續的收入。
“基于我們在 AI 路線(xiàn)圖執行方面取得的快速進(jìn)展以及云客戶(hù)的購買(mǎi)承諾,我們現在預計第四季度數據中心 GPU 收入約為 4 億美元,隨著(zhù)全年收入的增長(cháng),到 2024 年將超過(guò) 20 億美元?!?AMD 首席執行官蘇姿豐 (Lisa Su) 在與華爾街分析師討論 2023 年第三季度財務(wù)業(yè)績(jì)的電話(huà)會(huì )議上表示?!斑@種增長(cháng)將使 MI300 成為 AMD 歷史上銷(xiāo)售額達到 10 億美元最快的產(chǎn)品?!?/p>
確實(shí)如此,但該坡道的跑道是在 2015 年左右開(kāi)始建造的——就像 Epyc CPU 坡道一樣。但當時(shí),AMD 規模太小、實(shí)力太弱,無(wú)法同時(shí)在 CPU 和 GPU 領(lǐng)域大放異彩。實(shí)際上,Epyc 的成功為 Instinct 的成功提供了資金支持。
更具體地說(shuō),Su 在后來(lái)的電話(huà)會(huì )議中表示,AMD 預計 Instinct 系列將在 2023 年第四季度帶動(dòng)約 4 億美元的銷(xiāo)售額,這主要是由 HPC 市場(chǎng)推動(dòng)的,超大規模企業(yè)和云構建商的人工智能工作負載早期有所增加。如今,他們對任何類(lèi)型的矩陣數學(xué)計算都有著(zhù)巨大的興趣。我們認為這 4 億美元中的大約 3 億美元將用于支付 El Capitan 機器中的 MI300A 混合 CPU-GPU 計算引擎。AMD 預計 Instinct 銷(xiāo)售額將在 2024 年第一季度再增長(cháng) 4 億美元左右,主要由人工智能推動(dòng),一小部分來(lái)自 HPC 系統。(有時(shí)很難說(shuō)這條線(xiàn)在哪里。)在 2024 年剩余時(shí)間里,Instinct 的銷(xiāo)售額將大幅增長(cháng),并主要集中在人工智能工作負載上,最終全年收入約為 20 億美元。
如果你計算一下,AMD 在 2024 年每個(gè)季度的數據中心 GPU 收入銷(xiāo)售額將增加約 5000 萬(wàn)美元,達到 20 億美元。2021 年第三季度,當 AMD 為 Frontier 系統預訂了 MI250X GPU 銷(xiāo)售額的很大一部分時(shí),我們估計其數據中心 GPU 銷(xiāo)售額為 1.64 億美元,在我們的模型中,它在 2021 年第四季度又實(shí)現了 1.48 億美元的銷(xiāo)售額。因此,本季度和 2024 年第一季度的 4 億美元不僅意味著(zhù) GPU 的價(jià)格上漲,而且意味著(zhù)銷(xiāo)量的大幅增加。
這也許是一個(gè)更好的比較。在 MI200 系列全面推廣的前五個(gè)季度中,我們認為 AMD 的數據中心 GPU 銷(xiāo)售額約為 3.15 億美元,與 AMD 充滿(mǎn)信心地告訴我們的 24 億美元收入相比,這簡(jiǎn)直是小巫見(jiàn)大巫。因為我們認為它可以生產(chǎn)的所有 MI300 系列都已經(jīng)分配給 OEM、云和超大規模廠(chǎng)商——它可以在未來(lái)五個(gè)季度內完成。這是收入增長(cháng) 7.6 倍的一個(gè)因素。順便說(shuō)一句,我們認為 AMD 完全受到從臺積電獲得的 CoWoS 芯片封裝的限制,而不是 Antares GPU 芯片產(chǎn)量,也不是 HBM3 內存可用性。如果臺積電可以生產(chǎn)更多的 MI300 單元,那么 AMD 就可以銷(xiāo)售更多的 MI300 單元。顯然,AMD 的 CoWoS 將于 2024 年大幅增長(cháng),但鑒于其巨大的財富和主導地位,Nvidia 在 HBM3 內存和 CoWoS 上的支出可以超過(guò) AMD。
盡管如此,盡管 Nvidia 擁有更大的數據中心 GPU 計算業(yè)務(wù),但沒(méi)有人能夠聲稱(chēng) AMD 本身沒(méi)有在小芯片和堆棧內存等方面進(jìn)行創(chuàng )新,并且它沒(méi)有在這方面擁有最聰明的頭腦。Earth 現在渴望讓他們的軟件在 AMD GPU 上運行,這樣他們就不會(huì )完全依賴(lài) Nvidia GPU。市場(chǎng)已經(jīng)完全擺脫了這種依賴(lài),就像 2010 年代末英特爾在數據中心的霸主地位一樣。
競爭不僅僅針對英偉達,而且已經(jīng)到來(lái)。而且這種情況不會(huì )減弱。期間。
現在唯一的問(wèn)題是,超大規模企業(yè)和云構建者能夠以多快的速度創(chuàng )建和提升自己的 AI 定制 ASIC。Nvidia 將做出反應并進(jìn)行創(chuàng )新,AMD 也會(huì )如此,但毫無(wú)疑問(wèn),Nvidia 在數據中心處于峰值控制和峰值定價(jià)。這就是為什么它可能會(huì )考慮使用自己的 Arm 芯片在客戶(hù)端 CPU 市場(chǎng)上與英特爾和 AMD 展開(kāi)競爭。如果有人在一條戰線(xiàn)上攻擊你,你就會(huì )在另一條戰線(xiàn)上進(jìn)行防御并發(fā)起戰斗。
由于“Genoa”和“Bergamo”Epyc 服務(wù)器 CPU 的增加,以及云計算、超大規模企業(yè)和一些企業(yè)在人工智能系統之外的高端 CPU 上的一些新支出,以及 PC 支出的某種程度的復蘇,AMD 第三季度的業(yè)績(jì)并不如預期。與 2023 年前兩個(gè)季度一樣糟糕。AMD 總收入為 58 億美元,增長(cháng) 4.2%,凈利潤增長(cháng) 4.5 倍,達到 2.99 億美元。

銷(xiāo)售 PC CPU 和 GPU 的 Client 集團銷(xiāo)售額為 15.1 億美元,增長(cháng) 42.2%,去年同期銷(xiāo)售額為 10.2 億美元,營(yíng)業(yè)虧損為 2600 萬(wàn)美元,今年營(yíng)業(yè)收益為 1.4 億美元周?chē)?,這有幫助。游戲銷(xiāo)售(顧名思義,主要是針對游戲玩家的獨立 GPU)銷(xiāo)售額也達到 15.1 億美元,但下降了 7.7%,盡管營(yíng)業(yè)收入增長(cháng)了 46.5% 至 2.08 億美元。嵌入式部門(mén)主要是游戲機芯片加上與數據中心無(wú)關(guān)的賽靈思業(yè)務(wù),其銷(xiāo)售額為 12.4 億美元,下降 4.6%,營(yíng)業(yè)收入為 6.12 億美元,下降 3.6%。
您可以明白為什么 AMD 為 Xilinx 支付了如此高的價(jià)格。該部門(mén)的營(yíng)業(yè)收入幾乎與數據中心、客戶(hù)端和嵌入式部門(mén)的營(yíng)業(yè)收入總和一樣多。

現在讓我們深入了解數據中心部門(mén)。第三季度,CPU、GPU、DPU 和少數其他產(chǎn)品的收入略低于 16 億美元,同比下降了十分之七,但較 2023 年第二季度環(huán)比增長(cháng)了 21%。營(yíng)業(yè)收入據 AMD 稱(chēng),該公司的營(yíng)收下降了 29.4%,至 3.06 億美元,這主要是由于對未來(lái)人工智能產(chǎn)品的投資造成的。
AMD在電話(huà)會(huì )議上表示,就Epyc CPU銷(xiāo)量而言,客戶(hù)已經(jīng)達到了與Zen 4產(chǎn)品的交叉點(diǎn),代號為Genoa、Genoa-X和Bergamo,以及Siena 。(如果您想深入了解,這些鏈接是我們對 Epyc CPU 發(fā)布的報道。)我們的模型顯示,AMD 本季度的 Epyc CPU 銷(xiāo)售額為 14.8 億美元,與去年同期持平,而這比英特爾在同一季度遭受的重創(chuàng )要好得多,其數據中心和人工智能部門(mén)的銷(xiāo)售額為 38.1 億美元,下降 9.4%,出貨量下降 35%,平均售價(jià)上漲 38%。AMD 沒(méi)有提供任何有關(guān) Epyc 出貨量或 ASP 的指導。但我們會(huì )嘗試一下我們認為相關(guān)的統計數據。
我們認為,第三季度,超大規模廠(chǎng)商和云構建商約占 Epyc CPU 銷(xiāo)售額的 88%,收入略高于 13 億美元,同比增長(cháng) 10%,環(huán)比增長(cháng) 45.3%。如果這是正確的,那么企業(yè)、電信公司、服務(wù)提供商、政府和學(xué)術(shù)界僅占 Epyc 銷(xiāo)售額的 11%,即 1.78 億美元,同比下降 40%。我們還認為,2023 年第三季度數據中心 GPU 銷(xiāo)售額約為 5000 萬(wàn)美元,下降了 28.6%,因為客戶(hù)等待 MI300 系列,并且主要是由客戶(hù)購買(mǎi) MI210 和 MI250X GPU 推動(dòng)的。我們認為,數據中心 NIC 和 DPU 設備在 AMD 第三季度又帶動(dòng)了 1500 萬(wàn)美元的銷(xiāo)售額,而數據中心的 Versal FPGA 設備可能又帶動(dòng)了 5200 萬(wàn)美元的銷(xiāo)售額,并且根據我們的模型,2023 年迄今為止一直在連續下滑。
誠然,這都是很多猜測。但這些數字符合 AMD 在電話(huà)會(huì )議上所說(shuō)的內容,并且沒(méi)有違愛(ài)國爾街人士的情感,他們也在構建模型,以及我們在構建模型時(shí)與他們交談過(guò)的人。
來(lái)源:愛(ài)集微
-End-
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。