巨頭搶奪戰,HBM被徹底引爆
在英偉達一步步站穩萬(wàn)億市值腳根的道路上,少不了兩項關(guān)鍵技術(shù)支持,其中之一是由臺積電主導的 CoWoS 先進(jìn)封裝,另一個(gè)便是席卷當下的 HBM(高帶寬存儲)。
本文引用地址:http://dyxdggzs.com/article/202407/461090.htm英偉達 H200 是首次采用 HBM3E 存儲器規格的 AI 加速卡。借助內存速度更快、容量更大的 HBM3e,英偉達 H200 以每秒 4.8TB 的速度提供 141GB 的內存,與 A100 相比,容量幾乎是其兩倍,帶寬也提升了 43%,從而加速生成式 AI 和大語(yǔ)言模型,提高高性能計算(HPC)的工作負載。
隨著(zhù)人工智能的興起,HBM 成為巨頭們搶占的高地。三星、SK 海力士、美光等存儲巨頭紛紛將 HBM 視為重點(diǎn)生產(chǎn)產(chǎn)品之一。
HBM 的火熱,給市場(chǎng)掀起巨大波瀾。一起看看 HBM 這股熱潮給市場(chǎng)帶來(lái)了哪些轉折?
HBM 走紅,帶來(lái)三大影響
HBM 成為力挽行業(yè)下行的關(guān)鍵詞之一
數個(gè)季度的持續低迷下,頭部存儲廠(chǎng)商相繼展現出季度收入環(huán)比增長(cháng)趨勢,其中以 SK 海力士的表現最為亮眼,背后就離不開(kāi)由 HBM 拉動(dòng)對 DRAM 的需求提升。
今年 Q1,SK 海力士收入創(chuàng )歷史同期新高,營(yíng)業(yè)利潤也創(chuàng )下了市況最佳的 2018 年以來(lái)同期第二高,公司將其視為擺脫了長(cháng)時(shí)間的低迷期,開(kāi)始轉向了全面復蘇期。SK 海力士表示:「憑借 HBM 等面向 AI 的存儲器技術(shù)領(lǐng)導力,公司提升了面向 AI 服務(wù)器的產(chǎn)品銷(xiāo)量,同時(shí)持續實(shí)施以盈利為主的經(jīng)營(yíng)活動(dòng),從而實(shí)現了營(yíng)業(yè)利潤環(huán)比增長(cháng) 734% 的業(yè)績(jì)?!?/p>
三星電子曾表示生成式 AI 市場(chǎng)應用將帶來(lái) HBM 等支持大規模數據處理的內存產(chǎn)品需求快速增長(cháng),公司接到了大量客戶(hù)需求。預計 2024 年 HBM 的需求可能出現陡峭增長(cháng)。
美光表示,AI 服務(wù)器的 DRAM 容量是普通服務(wù)器的 6 倍到 8 倍,NAND 容量是普通服務(wù)器的 3 倍。英偉達 DGX GH200 所需的 DRAM 容量是普通服務(wù)器的數百倍。
通用 DRAM 恐缺貨漲價(jià)
通用型 DRAM 內存芯片面臨的供應短缺,主要源于業(yè)界對 HBM 等類(lèi)型的 DRAM 進(jìn)行了大量的投資,而通用型 DRAM 的產(chǎn)能利用率相對較低。目前,三星和 SK 海力士的產(chǎn)能利用率僅為 80% 到 90%,遠低于 NAND 閃存的全速生產(chǎn)狀態(tài)。
自 2024 年初以來(lái),通用型 DRAM 的產(chǎn)能僅提升了大約 10%,但智能手機、PC 和服務(wù)器市場(chǎng)的增長(cháng)率預計僅為 2% 到 3%。全球云計算和科技公司在 AI 基礎設施上的投資削減,并未能顯著(zhù)推動(dòng) DRAM 需求的復蘇。
然而,在同一時(shí)期內,企業(yè)級固態(tài)硬盤(pán)(eSSD)的需求卻因人工智能的普及而激增。因此,三星、SK 海力士等主要制造商在第二季度滿(mǎn)負荷運行其 NAND 生產(chǎn)線(xiàn)。此外,鎧俠也在市場(chǎng)條件改善后結束了減產(chǎn),NAND 產(chǎn)能利用率恢復至 100%。
由于通用 DRAM 內存芯片在消費市場(chǎng),如個(gè)人電腦和移動(dòng)終端等領(lǐng)域發(fā)揮著(zhù)巨大作用,而隨著(zhù)市場(chǎng)需求的放大,可能會(huì )出現大范圍的短缺。根據摩根士丹利最新報告,全球內存市場(chǎng)在 2025 年將迎來(lái)一次前所未有的供需失衡,2025 年 HBM 的供應不足率將達到-11%,而整個(gè) DRAM 市場(chǎng)的供應不足率將高達-23%。
爭奪戰,不只是技術(shù)
存儲巨頭在 HBM 技術(shù)領(lǐng)域的爭奪戰日益激烈,從 HBM1 到 HBM2、HBM3,再到最新的 HBM3e,每一代技術(shù)的演進(jìn)都標志著(zhù)存儲性能的顯著(zhù)提升和市場(chǎng)競爭的加劇。
HBM1 最早于 2014 年由 AMD 與 SK 海力士共同推出,作為 GDDR 競品,為 4 層 die 堆疊,提供 128GB/s 帶寬,4GB 內存,顯著(zhù)優(yōu)于同期 GDDR5。
HBM2 于 2016 年發(fā)布,2018 年正式推出,為 4 層 DRAMdie,現在多為 8 層 die,提供 256GB/s 帶寬,2.4Gbps 傳輸速度,和 8GB 內存。
HBM2E 于 2018 年發(fā)布,于 2020 年正式提出,在傳輸速度和內存等方面均有較大提升,提供 3.6Gbps 傳輸速度,和 16GB 內存。
HBM3 于 2020 年發(fā)布,2022 年正式推出,堆疊層數及管理通道數均有增加,提供 6.4Gbps 傳輸速度,傳輸速度最高可達 819GB/s,和 16GB 內存。
HBM3E 由 SK 海力士發(fā)布 HBM3 的增強版,提供高達 8Gbps 的傳輸速度,24GB 容量,2024 年開(kāi)始大規模量產(chǎn)。
然而這不僅僅是一場(chǎng)單純的技術(shù)較量,更是一場(chǎng)激烈無(wú)比的產(chǎn)能競賽。
根據存儲三巨頭表示,今年的 HBM 供應能力已全部耗盡,明年的產(chǎn)能也已經(jīng)大部分售罄。據專(zhuān)業(yè)機構分析,今明兩年 HBM 需求的動(dòng)態(tài)缺口約為產(chǎn)能的 5.5% 和 3.5%。因此,三大廠(chǎng)商紛紛開(kāi)啟產(chǎn)能沖刺競賽。比如 SK 海力士正在大幅擴產(chǎn)第 5 代 1b DRAM,以應對 HBM 與 DDR5 DRAM 的需求增加。按照晶圓投入量看,公司計劃將 1b DRAM 月產(chǎn)能從今年一季度的 1 萬(wàn)片增加到年末的 9 萬(wàn)片,到明年上半年進(jìn)一步提升至 14 萬(wàn)-15 萬(wàn)片,是今年一季度產(chǎn)能的 14-15 倍。三星 3 月底曾表示,預計今年 HBM 產(chǎn)能將增至去年的 2.9 倍。美光正在美國建設先進(jìn)的 HBM 測試生產(chǎn)線(xiàn),并考慮首次在馬來(lái)西亞生產(chǎn) HBM,以抓住 AI 熱潮帶來(lái)的更多需求。
相比 GDDR,HBM 強在哪兒?
根據產(chǎn)品分類(lèi),DRAM 可以分為 DDR、LPDDR、GDDR、HBM。前三類(lèi)產(chǎn)品主要用于傳統周期領(lǐng)域,HBM 則主要是 AI 市場(chǎng)的帶動(dòng)。其中 DDR 主要用于消費電子、服務(wù)器、PC 領(lǐng)域;LPDDR 主要用于移動(dòng)設備、手機及汽車(chē)領(lǐng)域;GDDR 主要用于圖像處理方面的 GPU 等。
隨著(zhù)數據量越發(fā)龐大加之 AI 芯片的加速發(fā)展,馮氏計算架構問(wèn)題凸顯:「存」「算」之間性能失配,使得計算機的計算能力增長(cháng)遇到瓶頸,雖然多核并行加速技術(shù)可以提高算力,但存儲帶寬的限制仍對計算系統的算力提升產(chǎn)生了制約。GDDR 是目前應用較為廣泛的顯存技術(shù),但在 AI 計算領(lǐng)域 GDDR 也難堪重任,于是制造商將目光投向 HBM 技術(shù)。
HBM 具備高帶寬的優(yōu)勢。通過(guò)多層堆疊,HBM 能達到更高的 I/O 數量,使得顯存位寬達到 1024 位,幾乎是 GDDR 的 32 倍,顯存帶寬顯著(zhù)提升。顯存帶寬顯著(zhù)提升解決了過(guò)去 AI 計算「內存墻」的問(wèn)題,HBM 逐步提高在中高端數據中心 GPU 中的滲透比率。
HBM 具備高密度、小體積等優(yōu)勢。相比傳統 DRAM,HBM 在相同的物理空間內能夠容納更多的存儲單元,從而提供更高的存儲容量。這對于存儲千億參數乃至更大規模的大模型至關(guān)重要。此外,HBM 通過(guò) 3D 封裝工藝實(shí)現 DRAM die 的垂直方向堆疊封裝,可以較大程度節約存儲芯片在片上占據的面積。HBM 芯片的尺寸比傳統的 DDR4 芯片小 20%,比 GDDR5 芯片節省了 94% 的表面積。根據三星電子的統計,3D TSV 工藝較傳統 POP 封裝形式節省了 35% 的封裝尺寸。
受構造影響,GDDR 的總帶寬上限低于 HBM??値?I/O 數據速率(Gb/s)*位寬/8。為解決 DDR 帶寬較低的問(wèn)題,本質(zhì)上需要對單 I/O 的數據速率和位寬(I/O 數*單 I/O 位寬)進(jìn)行提升,可分為 GDDR 單體式方案和 HBM 堆疊式方案。單體式 GDDR 采取大幅提升單 I/O 數據速率的手段來(lái)改善總帶寬,GDDR5 和 GDDR6 的單 I/O 數據速率已達到 7 Gb/s 到 16Gb/s,超過(guò) HBM3 的 6.4 Gb/s。HBM 利用 TSV 技術(shù)提升 I/O 數和單 I/O 位寬,從而大幅提升位寬,雖然維持較低的單 I/O 數據速率,但總帶寬遠優(yōu)于 GDDR。
HBM 的綜合功耗也低于 GDDR。HBM 通過(guò)增加 I/O 引腳數量來(lái)降低總線(xiàn)頻率,從而實(shí)現更低的功耗。盡管片上分布的大量緩存能提供足夠的計算帶寬,但由于存儲結構和工藝制約,片上緩存占用了大部分的芯片面積(通常為 1/3 至 2/3),限制了算力提升。
如今,HBM 已經(jīng)成為超級計算機、數據中心等核心設施中不可或缺的關(guān)鍵組件,為大規模并行計算提供了堅實(shí)的內存基礎。尤其在圖形處理領(lǐng)域,HBM 的高帶寬特性使得 GPU 能夠更快速地訪(fǎng)問(wèn)和處理圖像數據,從而為用戶(hù)帶來(lái)更加流暢、逼真的視覺(jué)體驗。
即便是業(yè)界領(lǐng)先的英偉達,也對這一產(chǎn)品展現出了高度的依賴(lài)性。據悉,英偉達近幾年發(fā)布的多款旗艦產(chǎn)品(如 A100、H100、H200)均搭配了不同數量的 HBM。HBM 已然是英偉達 AI 芯片的必備搭檔。然而全球約九成的 HBM 市場(chǎng)被 SK 海力士和三星兩家韓系企業(yè)壟斷。
2024 年末,HBM 是持續短缺?還是供過(guò)于求?
在存儲三巨頭的競爭中,由于海力士 HBM3 產(chǎn)品性能領(lǐng)先,率先拿下英偉達訂單,成為其服務(wù)器 GPU 的主要供應商。
三星主攻一些云端客戶(hù)的訂單,美光則直接跳過(guò)了 HBM3,將主要精力放在了 HBM3E 產(chǎn)品上。僅從當下來(lái)看,美光的市場(chǎng)占有率和前面兩個(gè)玩家有一些差距。
但不管怎樣,三位存儲芯片的大佬都在擴產(chǎn)能上不留余力。比如海力士已經(jīng)放下豪言壯語(yǔ),計劃到 2028 年投資高達 748 億美元,其中 80% 將用于 HBM 的研發(fā)和生產(chǎn),而且將下一代 HBM4 芯片的量產(chǎn)時(shí)間提前到 2025 年。
據專(zhuān)業(yè)機構分析,今明兩年 HBM 需求的動(dòng)態(tài)缺口約為產(chǎn)能的 5.5% 和 3.5%。
不過(guò)根據海豚投研的數據顯示,HBM 有望從 2023 年末的「供不應求」轉為 2024 年末的「供大于求」。
海豚投研比較了 2023—2024 年 HBM 的供需關(guān)系情況。 從需求端來(lái)看,結合云服務(wù)廠(chǎng)商的資本開(kāi)支和 AI 出貨量情況,市場(chǎng)對 HBM 的需求有望從 2023 年的 284MGB 提升至 512MGB; 從供給端來(lái)看,結合存儲主流廠(chǎng)商的產(chǎn)能計劃,HBM 的供給端更可能從 2023 年的 147MGB 快速提升至 1000MGB 以上。
在此供需關(guān)系中,2023 年供給端僅能滿(mǎn)足需求的 1/2,嚴重供不應求。供不應求的局面,推動(dòng)各家廠(chǎng)商大幅提升產(chǎn)能計劃。如果產(chǎn)能規劃如實(shí)落地,2024 年的 HBM 供需關(guān)系可能會(huì )出現明顯反轉,供給端反而會(huì )超出整體的市場(chǎng)需求。
對于 HBM 的價(jià)格,當前由于供給仍相對緊張,因此整體價(jià)格在 2024 年將有所上漲。但隨著(zhù)三星產(chǎn)品通過(guò)認證和產(chǎn)能端的釋放,HBM 的產(chǎn)品價(jià)格也可能出現回落。
國產(chǎn)廠(chǎng)商加速突破
隨著(zhù) AIGC 技術(shù)應用的快速發(fā)展,AI 服務(wù)器和高端 GPU 的需求持續增長(cháng),將進(jìn)一步推動(dòng) HBM 市場(chǎng)的高速增長(cháng)。據預計,到 2025 年,中國 HBM 的需求量規模有望超過(guò) 100 萬(wàn)顆。
而中國,在這一賽道還屬于后來(lái)者。
不久前,國家集成電路產(chǎn)業(yè)投資基金三期橫空出世。大基金三期注冊資本高達 3440 億元,這一規模遠超前兩期基金,顯示出國家對集成電路產(chǎn)業(yè)的重視和大力支持。如此龐大的資金注入,無(wú)疑將為集成電路產(chǎn)業(yè)的發(fā)展提供強大的動(dòng)力。
目前,大基金三期對外投資重點(diǎn)還未正式披露。據悉,大基金三期有望增加覆蓋人工智能芯片環(huán)節,在 HBM 產(chǎn)業(yè)鏈扶持大型晶圓廠(chǎng)。
今年 3 月,武漢新芯發(fā)布了《高帶寬存儲芯粒先進(jìn)封裝技術(shù)研發(fā)和產(chǎn)線(xiàn)建設》招標項目,這一行動(dòng)標志著(zhù)該公司正式進(jìn)軍 HBM 市場(chǎng)。通過(guò)利用三維集成多晶圓堆疊技術(shù),武漢新芯旨在打造更高容量、更大帶寬、更小功耗的存儲解決方案,以滿(mǎn)足市場(chǎng)對高性能存儲芯片的需求。面對海外大廠(chǎng)對于 HBM3E 的量產(chǎn),國內存儲廠(chǎng)商也在 HBM 技術(shù)上進(jìn)行著(zhù)加速突破,有望在 AI 大浪潮的需求下提升競爭實(shí)力。
面對海外大廠(chǎng)對于 HBM3E 的量產(chǎn),國內存儲廠(chǎng)商也在 HBM 技術(shù)上進(jìn)行著(zhù)加速突破,有望在 AI 大浪潮的需求下提升競爭實(shí)力。
封測龍頭長(cháng)電科技在投資者互動(dòng)中表示,其 XDFOI 高密度扇出封裝解決方案也同樣適用于 HBM 的 Chip to Wafer 和 Chip to Chip TSV 堆疊應用;通富微電此前表示,南通通富工廠(chǎng)先進(jìn)封裝生產(chǎn)線(xiàn)建成后,公司將成為國內最先進(jìn)的 2.5D/3D 先進(jìn)封裝研發(fā)及量產(chǎn)基地,實(shí)現國內在 HBM(高帶寬內存)高性能封裝技術(shù)領(lǐng)域的突破,對于國家在集成電路封測領(lǐng)域具有重要意義。
中國主要的存儲芯片公司也在與封測廠(chǎng)商通富微電合作開(kāi)展 HBM 相關(guān)項目。
然而總體來(lái)看,國內廠(chǎng)商在 HBM 技術(shù)上的發(fā)展仍處于早期階段。盡管?chē)H上已經(jīng)有了更先進(jìn)的 HBM3 和 HBM3E 產(chǎn)品,但國內存儲廠(chǎng)商目前還處于 HBM2 的研發(fā)和產(chǎn)業(yè)化階段。
面對海外大廠(chǎng)在 HBM3E 等先進(jìn)技術(shù)上的量產(chǎn)優(yōu)勢,國內廠(chǎng)商仍需加快追趕步伐,克服技術(shù)壁壘,實(shí)現從技術(shù)跟隨到技術(shù)引領(lǐng)的轉變。在此過(guò)程中,客戶(hù)對于 AI 服務(wù)器性能、內存帶寬及內存大小的持續高要求,既是對 HBM 技術(shù)的巨大挑戰,也是推動(dòng)其不斷前行的動(dòng)力源泉。
值得注意的是,盡管 HBM 在帶寬性能上占據優(yōu)勢地位,但其高昂的成本與功耗也促使行業(yè)探索更多元化的解決方案。GDDR、LPDDR 等內存技術(shù)的快速發(fā)展,為 AI 處理器提供了更多選擇,尤其是在成本、性能與功耗之間尋求最佳平衡點(diǎn)的應用場(chǎng)景中。例如,GDDR7 的推出不僅顯著(zhù)提升了內存容量與數據傳輸率,還因其相對較低的復雜度成為部分 AI 應用的理想之選。
綜上所述,隨著(zhù) AI 技術(shù)的不斷演進(jìn)與市場(chǎng)需求的日益多樣化,HBM 作為高性能存儲技術(shù)的代表,將繼續在特定領(lǐng)域發(fā)揮關(guān)鍵作用。同時(shí),國內廠(chǎng)商需緊抓機遇,加速技術(shù)創(chuàng )新與產(chǎn)業(yè)升級,以更加靈活多樣的內存解決方案,滿(mǎn)足 AI 時(shí)代對高性能計算的多元化需求。
評論