AMD能否撼動(dòng)英偉達AI霸主地位
財報顯示,AMD第二季度的收入和盈利均兩位數下滑,但還沒(méi)有華爾街預期的降幅大:AMD當季營(yíng)收54億美元,分析師預期53.2億美元;二季度調整后運營(yíng)利潤率20%,分析師預期19.5%。
本文引用地址:http://dyxdggzs.com/article/202308/449252.htmAMD首席執行官蘇姿豐(Lisa Su)指出,二季度業(yè)績(jì)強勁得益于,數據中心業(yè)務(wù)中的第四代EPYC CPU和PC業(yè)務(wù)相關(guān)的Ryzen 7000 CPU銷(xiāo)售大幅增長(cháng)。
同時(shí),蘇姿豐在與分析師的電話(huà)會(huì )議上表示,到2027年,數據中心的人工智能加速器市場(chǎng)可能會(huì )超過(guò)1500億美元。個(gè)人電腦是推動(dòng)半導體處理器銷(xiāo)量的傳統產(chǎn)品,但隨著(zhù)個(gè)人電腦銷(xiāo)量下滑,人工智能芯片成為半導體行業(yè)的新亮點(diǎn)之一。
生成式AI和大語(yǔ)言模型(LLM)需要的算力和內存大幅提高。預計今年,數據中心AI加速器的市場(chǎng)將達到300億美元左右,到2027年將超過(guò)1500億美元,復合年增長(cháng)率超過(guò)50%。這意味著(zhù)未來(lái)四年的CAGR將會(huì )超過(guò)50%。
AMD實(shí)現硬軟件關(guān)鍵里程碑
在今年5月公布一季度財報后,蘇姿豐就曾表示,AI現在是AMD的頭號優(yōu)先要務(wù),“雖然我們仍處于人工智能新時(shí)代的早期階段,但很明顯,人工智能為AMD帶來(lái)了數十億美元的增長(cháng)機會(huì )”。
AI是塑造下一代計算的決定性技術(shù),也是AMD最大的戰略增長(cháng)機會(huì )。AMD正在增加AI相關(guān)的研發(fā)支出,并已經(jīng)制定AI戰略 —— 包括AI專(zhuān)用芯片和軟件的開(kāi)發(fā),在實(shí)現硬軟件關(guān)鍵里程碑方面取得了巨大進(jìn)展。
· MI300A:MI300A是AMD為AI和高性能計算(HPC)打造的一系列最新APU加速卡之一,采用3D堆疊技術(shù)和Chiplet設計,配備了基于5nm制程的9個(gè)芯片組,置于基于6nm制程的4個(gè)芯片組之上,其晶體管數量達到1460億。其中有24個(gè)Zen 4 CPU核心,一個(gè)CDNA 3圖形引擎,內置128GB的HBM3內存。相較上一代的MI250X,MI300在A(yíng)I上的算力(TFLOPS)預計能提升8倍,能耗性能(TFLOPS/watt)將優(yōu)化5倍。
· MI300X:MI300X是針對LLM設計的MI300A優(yōu)化版本,內部沒(méi)有集成CPU內核,而是采用基于CDNA 3架構8個(gè)GPU芯粒以及另外4個(gè)I/O內存芯粒組成的芯片,晶體管達到1530億個(gè),是目前全球最大的邏輯處理器。內存達到了192GB,內存帶寬為5.2TB/s,Infinity Fabric帶寬為896GB/s,高內存密度和高內存帶寬使得MI300X在運行大模型(如GPT-3、PaLM2等)方面更具優(yōu)勢。
基于MI300X,AMD還宣布了Instinct平臺,其搭載8顆MI300X,提供總計1.5TB的內存,意味著(zhù)該計算平臺能訓練參數規模更大的大語(yǔ)言模型。
除了硬件,AMD也在加大軟件生態(tài)的投入,推出了用于數據中心加速、一套完整軟件棧工具AMD ROCm系統,包括為PyTorch 2.0提供即時(shí)“零日”支持,AI模型“開(kāi)箱即用”等。ROCm軟件??膳c模型、庫、框架和工具的開(kāi)放生態(tài)系統配合使用,TensorFlow和Caffe深度學(xué)習框架也已加入第五代ROCm。
去年11月ChatGPT發(fā)布以來(lái),人工智能領(lǐng)域對算力的需求空前提升,提供底層算力的英偉達是最大的受益者,其GPU產(chǎn)品在A(yíng)I大模型訓練上幾無(wú)替代品。隨著(zhù)AMD收購賽靈思完成后,其在A(yíng)I領(lǐng)域的力度明顯加大,也希望把握生成式AI帶來(lái)的重大機遇。
此次MI300X新一代服務(wù)器處理器系列等產(chǎn)品披露進(jìn)展后,AMD的計算產(chǎn)品線(xiàn)將從CPU、GPU、FPGA、DPU延伸至軟件平臺,形成與英偉達的全面競爭格局。
欲與英偉達試比高
目前,英偉達在A(yíng)I領(lǐng)域處于制霸地位,它在A(yíng)I處理器市場(chǎng)上占據大約80%的份額,其高端處理器已被用于訓練和運行各種聊天機器人。
在2016年的GTC China大會(huì )上,黃仁勛就表示:“AI算力將是未來(lái)科技發(fā)展的核心,因此英偉達不再是一個(gè)半導體公司,而是一家AI計算公司”。之后一直專(zhuān)注于提升AI算力,成功搭上ChatGPT的浪潮,在2023年5月30日,英偉達市值突破萬(wàn)億美金。再回過(guò)頭,英偉達已經(jīng)順AI之勢成了難以撼動(dòng)的巨無(wú)霸。
面對五年復合增幅可達50%以上的市場(chǎng)需求量,AMD很難不心動(dòng),MI300新系產(chǎn)品線(xiàn)的亮相,或將成為能夠與英偉達一決高下的“終極武器”。值得注意的是,因為多個(gè)客戶(hù)啟動(dòng)或擴大支持AMD Instinct加速器未來(lái)大規模部署的計劃,AMD的AI參與度在二季度增長(cháng)了七倍多。
對標英偉達AI芯片H100的大模型專(zhuān)用芯片,AMD的MI300X號稱(chēng)HBM密度高達英偉達H100的2.4倍,HBM帶寬高達H100的1.6倍,單個(gè)芯片可運行多達800億參數的模型,可以運行比H100更大的模型,相比之下,H100芯片只能支持120GB的內存。雖然英偉達在這一點(diǎn)上可能將很快迎頭趕上,甚至在相同的時(shí)間框架內實(shí)現反超,但在這一新興市場(chǎng)的主導地位仍將受到挑戰。
隨著(zhù)模型規模越來(lái)越大,需要多個(gè)GPU來(lái)運行最新的大型語(yǔ)言模型,而當MI300X配置更大的內存,生成式AI模型可能就不再需要數目那么龐大的GPU,意味著(zhù)可以節約成本。
AMD尚未公布MI300定價(jià),但不難預測很可能將延續往日的高性?xún)r(jià)比定價(jià)風(fēng)格,重點(diǎn)關(guān)注先把市場(chǎng)打開(kāi)。在全球算力緊張、英偉達芯片價(jià)格居高不下的情況下,很可能選擇在英偉達產(chǎn)品的價(jià)格上給壓力。
此前,AMD表示MI300系列芯片將于第三季度開(kāi)始批量生產(chǎn),并將于第四季度開(kāi)始量產(chǎn),并沒(méi)有透露具體有哪些公司將計劃購買(mǎi)MI300X或MI300A。
AMD真的能逆襲英偉達嗎?
AMD的MI300系列是目前從硬件水平上最接近H100的產(chǎn)品,但MI300X并沒(méi)有像H100的Transformer Engine(用加速Transformer大模型的引擎),H100可以將大語(yǔ)言模型(LLM)的性能提高兩倍,這也意味著(zhù)用同樣數量的MI300X將花費更長(cháng)的訓練時(shí)間。
同時(shí)算力的比拼,除了硬件端,其實(shí)還有軟件端的較量。MI300系列的發(fā)布雖然在硬件參數上努力實(shí)現對標,而在軟件端存在不少的差距,需要更多的時(shí)間來(lái)追趕。
英偉達CUDA軟件生態(tài)帝國早在2007年就開(kāi)始起步,AMD的ROCm在2016年才發(fā)布,ROCm操作系統長(cháng)期只支持Linux,最近才登錄Windows,但由于前期積累的較少,在開(kāi)發(fā)者數量和軟件包數量上遠遠落后。在Github上,貢獻CUDA軟件包倉庫的開(kāi)發(fā)者超過(guò)32600位,而ROCm只有不到600個(gè),這很大程度影響了客戶(hù)的使用。
CUDA是一個(gè)完全封閉的系統,綁定了百萬(wàn)計的開(kāi)發(fā)者。從2017年推出V100,到2020年推出A100,再到2022年推出H100,現如今英偉達的CUDA生態(tài)已經(jīng)積累了近250萬(wàn)開(kāi)發(fā)者,建立了其他競爭對手短時(shí)間難以逾越的護城河。
與英偉達獨有的CUDA生態(tài)不同,AMD推出ROCm生態(tài)圈,并實(shí)現通過(guò)HIP完全兼容CUDA,同時(shí)也與客戶(hù)包括微軟等合作重構自己的生態(tài)。雖能完全兼容CUDA,為AMD提供了說(shuō)服客戶(hù)遷移的條件和理由,但兼容只屬權宜之計,進(jìn)一步建立屬于自己的生態(tài)才能形成競爭優(yōu)勢。
目前可以真正兼容CUDA的除英偉達自身外就只有AMD一家,AMD和英偉達之間有相關(guān)的IP授權,這樣AMD的MI系列GPU可以使用CUDA,其他初創(chuàng )企業(yè)都不能直接使用CUDA。
從技術(shù)層面來(lái)看,兼容意味著(zhù)被動(dòng)、落后,因為CUDA每一次升級,ROCm都需要做出對應升級,技術(shù)團隊無(wú)法將所有精力用于ROCm生態(tài)圈的迭代上,應用場(chǎng)景和使用體驗都會(huì )落后于英偉達。
相比于英偉達,AMD無(wú)疑落后了半個(gè)身位。此外,英偉達已經(jīng)在交付H100,并表示在未來(lái)幾個(gè)季度會(huì )增加產(chǎn)量,其產(chǎn)品已得到客戶(hù)的認可和接受,并且已經(jīng)有完整的產(chǎn)業(yè)鏈為其供貨;而AMD的新品仍在試驗階段,還尚未披露任何基準測試,可能到下半年才會(huì )交付,還有許多問(wèn)題仍待解決。這或是市場(chǎng)有所保留的原因,新品推出都需要經(jīng)過(guò)市場(chǎng)長(cháng)時(shí)間的驗證。
在行業(yè)景氣度持續上升的背景下,誰(shuí)能率先完成獨有的軟件生態(tài),誰(shuí)就有可能挑戰英偉達在訓練芯片的市場(chǎng)地位,目前看最有機會(huì )的就是AMD。期待今年晚些時(shí)候能夠看到一些與同業(yè)競爭對手的比較。
有望帶動(dòng)良性競爭
因為英偉達在算力芯片上具有絕對領(lǐng)先的地位,而當前AI需求的激增讓A100、H100等產(chǎn)品供不應求,其訂單已經(jīng)排至2024年,像H100在明年一季度之前都處于售罄狀態(tài)。
MI300X的推出給市場(chǎng)帶來(lái)打破英偉達“一家獨大”局面的希望,大模型玩家渴望通過(guò)使用更優(yōu)秀產(chǎn)品,以減少與OpenAI等廠(chǎng)商算力支持差距。雖然從短期看,兩家之間仍有不小的差距,但中長(cháng)期的角度,市場(chǎng)追趕者的出現還是能加劇算力端的競爭,有助于降低AI芯片的價(jià)格,更利于技術(shù)的迭代和進(jìn)步。
潛在客戶(hù)對MI300非常感興趣,希望能夠在英偉達的芯片之外,還有一個(gè)替代的選項。如果AMD的MI300系列被開(kāi)發(fā)者和服務(wù)器制造商當成英偉達產(chǎn)品的替代品,就很可能意味著(zhù)AMD將迎來(lái)一個(gè)有待開(kāi)發(fā)的巨大市場(chǎng)。
AI芯片的競爭還是處在一片正在快速擴張的藍海之中,隨著(zhù)AI應用越來(lái)越深入我們的生活,更加難以想象AI芯片市場(chǎng)的規模極限,其中留給AMD和英偉達的空間自然也足夠大。英偉達盡管通過(guò)長(cháng)期積累建立了強大的優(yōu)勢,但還有足夠的市場(chǎng)需求等待AMD滿(mǎn)足,這也是后者的機會(huì )所在。
AI市場(chǎng)的競爭也是一場(chǎng)持久戰,AMD在不斷進(jìn)行技術(shù)創(chuàng )新和市場(chǎng)布局,未來(lái)也有可能實(shí)現逆襲。無(wú)論是英偉達還是AMD,誰(shuí)能笑到最后還是看長(cháng)期的發(fā)展潛能。
另外,還有中央處理器巨頭英特爾最近也正調整發(fā)展戰略,以把握AI發(fā)展的契機,開(kāi)始發(fā)力人工智能芯片。AMD面對的競爭將會(huì )加劇,AI的戰役或才剛剛展開(kāi)。
評論