<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > HBM的未來(lái)：必要但昂貴

HBM的未來(lái)：必要但昂貴

發(fā)布人：傳感器技術(shù) 時(shí)間：2023-07-26 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

高帶寬內存 (HBM) 正在成為超大規模廠(chǎng)商的首選內存，但其在主流市場(chǎng)的最終命運仍存在疑問(wèn)。雖然它在數據中心中已經(jīng)很成熟，并且由于人工智能/機器學(xué)習的需求而使用量不斷增長(cháng)，但其基本設計固有的缺陷阻礙了更廣泛的采用。一方面，HBM 提供緊湊的 2.5D 外形尺寸，可大幅減少延遲。

Rambus產(chǎn)品營(yíng)銷(xiāo)高級總監 Frank Ferro在本周的 Rambus 設計峰會(huì )上的演講中表示：“HBM 的優(yōu)點(diǎn)在于，您可以在很小的占地面積內獲得所有這些帶寬，而且還可以獲得非常好的電源效率?！?/p>

缺點(diǎn)是它依賴(lài)昂貴的硅中介層和 TSV 來(lái)運行。

圖 1：實(shí)現最大數據吞吐量的 HBM 堆棧

Cadence IP 團隊產(chǎn)品營(yíng)銷(xiāo)總監 Marc Greenberg 表示：“目前困擾高帶寬內存的問(wèn)題之一是成本。3D 堆疊成本高昂。有一個(gè)邏輯芯片位于芯片堆疊的底部，這是您必須支付的額外硅片。然后是硅中介層，它位于 CPU 或 GPU 以及 HBM 內存下的所有內容之下。然后，你需要一個(gè)更大的封裝等等，這是需要昂貴的代價(jià)的?！盡arc Greenberg進(jìn)一步指出：“目前存在的 HBM 脫離了消費者領(lǐng)域，并更牢固地放置在服務(wù)器機房或數據中心，存在許多系統成本。相比之下，GDDR6 等圖形內存雖然無(wú)法提供與 HBM 一樣多的性能，但成本卻顯著(zhù)降低。GDDR6 的單位成本性能實(shí)際上比 HBM 好得多，但 GDDR6 器件的最大帶寬與 HBM 的最大帶寬不匹配?！?/p>

Greenberg 表示，這些差異為公司選擇 HBM 提供了令人信服的理由，即使它可能不是他們的第一選擇?！癏BM 提供了大量的帶寬，并且點(diǎn)對點(diǎn)傳輸的能量極低。您使用 HBM 是因為您必須這樣做，因為您沒(méi)有其他解決方案可以為您提供所需的帶寬或所需的功率配置文件?！?/p>

而且 HBM 只會(huì )變得越來(lái)越快?！拔覀冾A計 HBM3 Gen2 的帶寬將提高 50%，”美光計算產(chǎn)品事業(yè)部副總裁兼總經(jīng)理 Praveen Vaidyanathan 說(shuō)道?！皬拿拦獾慕嵌葋?lái)看，我們預計 HBM3 Gen2 產(chǎn)品將在 2024 財年期間實(shí)現量產(chǎn)。在 2024 日歷年年初，我們預計隨著(zhù)時(shí)間的推移，將開(kāi)始為預期的數億美元收入機會(huì )做出貢獻。此外，我們預測美光的 HBM3 將貢獻比 DRAM 更高的利潤?！?/p>

盡管如此，經(jīng)濟因素可能會(huì )迫使許多設計團隊考慮價(jià)格敏感應用的替代方案。

“如果有任何其他方法可以將問(wèn)題細分為更小的部分，您可能會(huì )發(fā)現它更具成本效益，”Greenberg 指出?！袄?，與其面對一個(gè)巨大的問(wèn)題并說(shuō)，‘我必須在一個(gè)硬件上執行所有這些操作，而且我必須在那里擁有 HBM，也許我可以將其分成兩部分，讓兩個(gè)進(jìn)程并行運行，也許連接到 DDR6。如果我能夠將該問(wèn)題細分為更小的部分，那么我可能會(huì )以更低的成本完成相同數量的計算。但如果您需要那么大的帶寬，那么 HBM 就是您可以承受成本的方法?！?/p>

散熱挑戰

另一個(gè)主要缺點(diǎn)是 HBM 的 2.5D 結構會(huì )積聚熱量，而其放置在靠近 CPU 和 GPU 的位置會(huì )加劇這種情況。事實(shí)上，在試圖給出不良設計的理論示例時(shí)，很難想出比當前布局更糟糕的東西，當前布局將 HBM及其熱敏 DRAM 堆棧放置在計算密集型熱源附近。

“最大的挑戰是熱量，”Greenberg 說(shuō)?！澳阌幸粋€(gè) CPU，根據定義它會(huì )生成大量數據。您通過(guò)此接口每秒傳輸太比特數。即使每筆交易只有少量皮焦耳，但每秒都會(huì )執行十億筆交易，因此您的 CPU 會(huì )非常熱。它不僅僅是移動(dòng)周?chē)臄祿?。它也必須進(jìn)行計算。最重要的是最不喜歡熱的半導體組件，即 DRAM。85℃左右它開(kāi)始忘記東西，125℃左右則完全心不在焉。這是兩個(gè)截然不同的事情?！?/p>

還有一個(gè)可取之處?！皳碛?2.5D 堆棧的優(yōu)勢在于，CPU 很熱，而 HBM 位于 CPU 旁邊，因此喜歡冷，之間有一定的物理隔離，”他說(shuō)。

在延遲和熱量之間的權衡中，延遲是不可變的?！拔覜](méi)有看到任何人犧牲延遲，”Synopsys 內存接口 IP 解決方案產(chǎn)品線(xiàn)總監 Brett Murdock說(shuō)道?！拔铱吹剿麄兺苿?dòng)物理團隊尋找更好的冷卻方式，或者更好的放置方式，以保持較低的延遲?！?/p>

考慮到這一挑戰，多物理場(chǎng)建?？梢蕴岢鰷p少熱問(wèn)題的方法，但會(huì )產(chǎn)生相關(guān)成本?！斑@就是物理學(xué)變得非常困難的地方，” Ansys產(chǎn)品經(jīng)理 Marc Swinnen 說(shuō)?！肮β士赡苁羌伤軐?shí)現的最大限制因素。任何人都可以設計一堆芯片并將它們全部連接起來(lái)，所有這些都可以完美工作，但你無(wú)法冷卻它。散發(fā)熱量是可實(shí)現目標的根本限制?！?/p>

潛在的緩解措施可能很快就會(huì )變得昂貴，從微流體通道到浸入非導電液體，再到確定散熱器上需要多少個(gè)風(fēng)扇或翅片，以及是否使用銅或鋁。

可能永遠不會(huì )有完美的答案，但模型和對期望結果的清晰理解可以幫助創(chuàng )建合理的解決方案?！澳惚仨毝x最佳對你來(lái)說(shuō)意味著(zhù)什么，”Swinnen說(shuō)?！澳阆胍詈玫臒崃繂?？最好的成本？?jì)烧咧g的最佳平衡？你將如何衡量它們？答案依賴(lài)于模型來(lái)了解物理學(xué)中實(shí)際發(fā)生的情況。它依靠人工智能來(lái)處理這種復雜性并創(chuàng )建元模型來(lái)捕捉這個(gè)特定優(yōu)化問(wèn)題的本質(zhì)，并快速探索這個(gè)廣闊的空間?！?/p>

HBM 和 AI

雖然很容易想象計算是 AI/ML 最密集的部分，但如果沒(méi)有良好的內存架構，這一切都不會(huì )發(fā)生。需要內存來(lái)存儲和檢索數萬(wàn)億次計算。事實(shí)上，在某種程度上，添加更多 CPU 并不會(huì )提高系統性能，因為內存帶寬無(wú)法支持它們。這就是臭名昭著(zhù)的“內存墻”瓶頸。

Quadric首席營(yíng)銷(xiāo)官 Steve Roddy 表示，從最廣泛的定義來(lái)看，機器學(xué)習只是曲線(xiàn)擬合?！霸谟柧氝\行的每次迭代中，你都在努力越來(lái)越接近曲線(xiàn)的最佳擬合。這是一個(gè) X,Y 圖，就像高中幾何一樣。大型語(yǔ)言模型基本上是同一件事，但是是 100 億維，而不是 2 維?！?/p>

因此，計算相對簡(jiǎn)單，但內存架構可能令人難以置信。

Roddy 解釋說(shuō)：“其中一些模型擁有 1000 億字節的數據，對于每次重新訓練迭代，您都必須通過(guò)數據中心的背板從磁盤(pán)上取出 1000 億字節的數據并放入計算箱中?！薄霸趦蓚€(gè)月的訓練過(guò)程中，你必須將這組巨大的內存值來(lái)回移動(dòng)數百萬(wàn)次。限制因素是數據的移入和移出，這就是為什么人們對 HBM 或光學(xué)互連等從內存傳輸到計算結構的東西感興趣。所有這些都是人們投入數十億美元風(fēng)險投資的地方，因為如果你能縮短距離或時(shí)間，你就可以大大簡(jiǎn)化和縮短訓練過(guò)程，無(wú)論是切斷電源還是加快訓練速度?！?/p>

出于所有這些原因，高帶寬內存被認為是 AI/ML 的首選內存?！八鼮槟峁┝四承┯柧毸惴ㄋ璧淖畲髱?，”Rambus 的 Ferro 說(shuō)?！皬哪憧梢該碛卸鄠€(gè)內存堆棧的角度來(lái)看，它是可配置的，這為你提供了非常高的帶寬?！?/p>

這就是人們對 HBM 如此感興趣的原因?！拔覀兊拇蠖鄶悼蛻?hù)都是人工智能客戶(hù)，”Synopsys 的Murdock說(shuō)?！八麄冋?LPDDR5X 接口和 HBM 接口之間進(jìn)行一項重大的基本權衡。唯一阻礙他們的是成本。他們真的很想去 HBM。這是他們對技術(shù)的渴望，因為你無(wú)法觸及在一個(gè) SoC 周?chē)梢詣?chuàng )建的帶寬量?，F在，我們看到 SoC 周?chē)胖昧?6 個(gè) HBM 堆棧，這需要大量的帶寬?！?/p>

然而，人工智能的需求如此之高，以至于 HBM 減少延遲的前沿特征突然顯得過(guò)時(shí)且不足。這反過(guò)來(lái)又推動(dòng)了下一代 HBM 的發(fā)展。

“延遲正在成為一個(gè)真正的問(wèn)題，”Ferro說(shuō)?！霸?HBM 的前兩輪中，我沒(méi)有聽(tīng)到任何人抱怨延遲?，F在我們一直收到有關(guān)延遲的問(wèn)題?！?/p>

Ferro 建議，鑒于當前的限制，了解數據尤為重要?！八赡苁沁B續的數據，例如視頻或語(yǔ)音識別。它可能是事務(wù)性的，就像財務(wù)數據一樣，可能非常隨機。如果您知道數據是隨機的，那么設置內存接口的方式將與流式傳輸視頻不同。這些是基本問(wèn)題，但也有更深層次的問(wèn)題。我要在記憶中使用的字長(cháng)是多少？?jì)却娴膲K大小是多少？您對此了解得越多，您設計系統的效率就越高。如果您了解它，那么您可以定制處理器以最大限度地提高計算能力和內存帶寬。我們看到越來(lái)越多的 ASIC 式 SoC 正在瞄準特定市場(chǎng)細分市場(chǎng)，以實(shí)現更高效的處理?！?/p>

使其更便宜（也許）

如果經(jīng)典的 HBM 實(shí)現是使用硅中介層，那么就有希望找到成本更低的解決方案?！斑€有一些方法可以在標準封裝中嵌入一小塊硅，這樣就沒(méi)有一個(gè)完整的硅中介層延伸到所有東西下面，”Greenberg說(shuō)?！癈PU 和 HBM 之間只有一座橋梁。此外，在標準封裝技術(shù)上允許更細的引腳間距也取得了進(jìn)展，這將顯著(zhù)降低成本。還有一些專(zhuān)有的解決方案，人們試圖通過(guò)高速 SerDes 類(lèi)型連接來(lái)連接存儲器，沿著(zhù) UCIE 的路線(xiàn)，并可能通過(guò)這些連接來(lái)連接存儲器。目前，這些解決方案是專(zhuān)有的，但我希望它們能夠標準化?！?/p>

Greenberg表示，可能存在平行的發(fā)展軌跡：“硅中介層確實(shí)提供了可能的最精細的引腳間距或線(xiàn)間距——基本上是用最少的能量實(shí)現最大的帶寬——所以硅中介層將永遠存在。但如果我們作為一個(gè)行業(yè)能夠聚集在一起并決定一個(gè)適用于標準封裝的內存標準，那么就有可能提供類(lèi)似的帶寬，但成本卻要低得多?！?/p>

人們正在不斷嘗試降低下一代的成本?！芭_積電已宣布他們擁有三種不同類(lèi)型的中介層，”Ferro 說(shuō)?！八麄冇幸粋€(gè) RDL 中介層，他們有硅中介層，他們有一些看起來(lái)有點(diǎn)像兩者的混合體。還有其他技術(shù)，例如如何完全擺脫中介層。您可能會(huì )在接下來(lái)的 12 或 18 個(gè)月內看到一些如何在頂部堆疊 3D 內存的原型，理論上可以擺脫中介層。事實(shí)上，IBM 多年來(lái)一直在這樣做，但現在已經(jīng)到了你不必成為 IBM 也能做到這一點(diǎn)的地步?！?/p>

解決該問(wèn)題的另一種方法是使用較便宜的材料?！罢谘芯糠浅＜氶g距的有機材料，以及它們是否足夠小以處理所有這些痕跡，”Ferro說(shuō)?！按送?，UCIe是通過(guò)更標準的材料連接芯片的另一種方式，以節省成本。但同樣，你仍然必須解決通過(guò)這些基材的數千條痕跡的問(wèn)題?！?/p>

Murdock希望通過(guò)規模經(jīng)濟來(lái)削減成本?！半S著(zhù) HBM 越來(lái)越受歡迎，成本方面將有所緩解。HBM 與任何 DRAM 一樣，歸根結底都是一個(gè)商品市場(chǎng)。在中介層方面，我認為下降速度不會(huì )那么快。這仍然是一個(gè)需要克服的挑戰?！?/p>

但原材料成本并不是唯一的考慮因素?！斑@還取決于 SoC 需要多少帶寬，以及電路板空間等其他成本，”Murdock 說(shuō)?！皩τ谀切┫胍咚俳涌诓⑿枰罅繋挼娜藖?lái)說(shuō)，LPDDR5X 是一種非常受歡迎的替代方案，但與 HBM 堆棧的通道數量相匹配所需的 LPDDR5X 通道數量相當大。您有大量的設備成本和電路板空間成本，這些成本可能令人望而卻步。僅就美元而言，也可能是一些物理限制促使人們轉向 HBM，盡管從美元角度來(lái)看它更昂貴?！?/p>

其他人對未來(lái)成本削減則不太確定。Objective Analysis 首席分析師 Jim Handy 表示：“降低 HBM 成本將是一項挑戰?！薄坝捎趯?TSV 放置在晶圓上的成本很高，因此加工成本已經(jīng)明顯高于標準 DRAM。這使得它無(wú)法擁有像標準 DRAM 一樣大的市場(chǎng)。由于市場(chǎng)較小，規模經(jīng)濟導致成本在一個(gè)自給自足的過(guò)程中更高。體積越小，成本越高，但成本越高，使用的體積就越少。沒(méi)有簡(jiǎn)單的方法可以解決這個(gè)問(wèn)題?！?/p>

盡管如此，Handy 對 HBM 的未來(lái)持樂(lè )觀(guān)態(tài)度，并指出與 SRAM 相比，它仍然表現出色?！癏BM 已經(jīng)是一個(gè)成熟的 JEDEC 標準產(chǎn)品，”他說(shuō)?！斑@是一種獨特的 DRAM 技術(shù)形式，能夠以比 SRAM 低得多的成本提供極高的帶寬。它還可以通過(guò)封裝提供比 SRAM 更高的密度。它會(huì )隨著(zhù)時(shí)間的推移而改進(jìn)，就像 DRAM 一樣。隨著(zhù)接口的成熟，預計會(huì )看到更多巧妙的技巧來(lái)提高其速度?！?/p>

事實(shí)上，盡管面臨所有挑戰，HBM 還是有理由保持樂(lè )觀(guān)?！皹藴收谘杆侔l(fā)展，”費羅補充道?！叭绻憧纯?HBM 如今的發(fā)展，你會(huì )發(fā)現它大約以?xún)赡隇楣澴?，這確實(shí)是一個(gè)驚人的速度?！?/p>

來(lái)源：半導體行業(yè)觀(guān)察

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： HBM

相關(guān)推薦

存儲技術(shù)，掀起一輪新革命

網(wǎng)絡(luò )與存儲 HBM | 2024-07-30

HBM新戰局，半導體存儲廠(chǎng)商們準備好了嗎？

網(wǎng)絡(luò )與存儲 HBM 半導體存儲 | 2024-07-16

HBM4持續加速：AI時(shí)代競爭新焦點(diǎn)

網(wǎng)絡(luò )與存儲 HBM AI 內存 | 2024-07-25

全球三大廠(chǎng)HBM沖擴產(chǎn) 明年倍增

網(wǎng)絡(luò )與存儲 SK海力士三星美光 HBM | 2024-07-10

巨頭搶奪戰，HBM被徹底引爆

網(wǎng)絡(luò )與存儲 HBM | 2024-07-17

ESD人體模型(HBM)與IEC IEC61000-4-2標準白皮書(shū)

資源下載 California Micro Devices IEC61000-4-2 HBM ESD | 2008-07-03

臺積電要抄三星的后路

網(wǎng)絡(luò )與存儲 HBM | 2024-07-23

存儲產(chǎn)業(yè)的下一個(gè)“新寵”是？

網(wǎng)絡(luò )與存儲存儲產(chǎn)業(yè) HBM MRDIMM MCRDIMM | 2024-07-25

信越推出新型半導體后端制造設備，可無(wú)需中介層實(shí)現 HBM 內存 2.5D 集成

EDA/PCB 信越化學(xué) HBM 先進(jìn)封裝 | 2024-07-11

HBM排擠效應 DRAM漲勢可期

網(wǎng)絡(luò )與存儲 HBM DRAM 美光 | 2024-07-18

防靜電技術(shù)及失效分析

資源下載防靜電失效分析 ESD 人體模型機器模型帶電器件模型 HBM MM CDM ASM SEM BGA | 2009-06-14

SK海力士將在HBM生產(chǎn)中采用混合鍵合技術(shù)

EDA/PCB SK 海力士 HBM 混合鍵合技術(shù) | 2024-07-17

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>