<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 網(wǎng)絡(luò )與存儲 > 市場(chǎng)分析 > 要打破內存墻,可以將HBM與DDR5融合

要打破內存墻,可以將HBM與DDR5融合

作者:nextplatfor 時(shí)間:2024-04-08 來(lái)源:半導體產(chǎn)業(yè)縱橫 收藏

在 2024 年,如果需要將數十個(gè)、數百個(gè)、數千個(gè)甚至數萬(wàn)個(gè)加速器拼接在一起,那么互連就是個(gè)大課題了。

本文引用地址:http://dyxdggzs.com/article/202404/457233.htm

英偉達(Nvidia) 擁有 NVLink 和 InfiniBand。Google 的 TPU 吊艙使用光電路開(kāi)關(guān)(OCS)相互通信。AMD 擁有 Infinity Fabric,用于芯片到芯片、芯片到芯片以及即將推出的節點(diǎn)到節點(diǎn)流量。當然,還有好的老式以太網(wǎng)。

這里的訣竅不是構建足夠大的網(wǎng)格,而是抵御與離包相關(guān)的大量性能損失和帶寬瓶頸。它也沒(méi)有做任何事情來(lái)解決這樣一個(gè)事實(shí),即所有這些 AI 處理所依賴(lài)的 HBM 內存都以固定的比例與計算相關(guān)聯(lián)。

「這個(gè)行業(yè)正在使用 Nvidia GPU 作為世界上最昂貴的內存控制器,」Dave Lazovsky 說(shuō),他的公司 Celestial AI 剛剛在 USIT 和許多其他風(fēng)險投資巨頭支持的 C 輪融資中獲得了 1.75 億美元,以將其光子織物商業(yè)化。

去年夏天,我們研究了 Celestial 的光子結構,其中包括一系列硅光子學(xué)互連器、中介層和,旨在將 AI 計算從內存中分解出來(lái)。不到一年后,他們正在與幾家超大規??蛻?hù)和一家大型處理器制造商合作,將其技術(shù)集成到他們的產(chǎn)品中。Lazovsky 沒(méi)有指名道姓。

但事實(shí)上,Celestial 將 AMD Ventures 視為其支持者之一,其高級副總裁兼產(chǎn)品技術(shù)架構師 Sam Naffziger 在公告發(fā)布的同一天討論了共同封裝硅光子的可能性,這無(wú)疑引起了一些人的注意。話(huà)雖如此,AMD 為光子學(xué)初創(chuàng )公司提供資金并不意味著(zhù)我們將永遠在 Epyc CPU 或 Instinct GPU 加速器中看到 Celestial 的。

雖然 Lazovsky 無(wú)法透露 Celestial 與誰(shuí)合作,但他確實(shí)提供了一些關(guān)于該技術(shù)如何集成的線(xiàn)索,以及即將推出的 HBM 內存設備的先睹為快。

正如我們在最初涉足 Celestial 的產(chǎn)品戰略時(shí)所討論的那樣,該公司的零件分為三大類(lèi):小芯片、中介層和英特爾 EMIB 或臺積電 CoWoS 的光學(xué)旋轉,稱(chēng)為 OMIB。

不出所料,Celestial 的大部分吸引力都集中在小芯片上?!肝覀儧](méi)有做的是試圖強迫我們的客戶(hù)采用任何一種特定的產(chǎn)品實(shí)施。目前,為光子結構提供接口的風(fēng)險最低、最快、最不復雜的方法是通過(guò)小芯片,「Lazovsky 告訴 The Next Platform。

從廣義上講,這些小芯片可以以?xún)煞N方式使用:要么增加額外的 HBM 內存容量,要么作為芯片到芯片的互連,分類(lèi)或類(lèi)似于光學(xué) NVLink 或 Infinity Fabric。

這些小芯片比 HBM 堆棧小一點(diǎn),提供光電互連,片外總帶寬為 14.4 Tb/s 或 1.8 GB/s。

話(huà)雖如此,我們被告知可以制造一個(gè)小芯片來(lái)支持更高的帶寬。第一代技術(shù)可以支持每平方毫米約 1.8 Tb/s 的速度。與此同時(shí),Celestial 的第二代 Photonic 結構將從 56 Gb/s 提高到 112 Gb/s 的 PAM4 SerDes,并將通道數量從 4 個(gè)增加到 8 個(gè),從而有效地將帶寬翻兩番。

因此,14.4 Tb/s 不是上限,而是現有芯片架構能夠處理的結果。這是有道理的,否則任何額外的容量都會(huì )被浪費。

這種連接性意味著(zhù) Celestial 可以實(shí)現類(lèi)似于 NVLink 的互連速度,只是沿途的步驟更少。

雖然芯片到芯片的連接相對不言自明——在每個(gè)封裝上放一個(gè)光子織物小芯片并對齊光纖連接——但內存擴展完全是另一種動(dòng)物。雖然 14.4 Tb/s 的速度并不慢,但對于多個(gè) HBM3 或 HBM3e 堆棧來(lái)說(shuō),它仍然是一個(gè)瓶頸。這意味著(zhù)添加更多的 HBM 只會(huì )讓您的容量超過(guò)某個(gè)點(diǎn)。盡管如此,用兩個(gè) HBM3e 堆棧代替一個(gè)堆棧并不算什么。

Celestial 有一個(gè)有趣的解決方法,即它的內存擴展模塊。由于帶寬的上限為 1.8 GB/s,因此該模塊將僅包含兩個(gè)總計 72 GB 的 HBM 堆棧。此外,還將配備一組 4 個(gè) DDR5 DIMM,支持高達 2 TB 的額外容量。

Lazovsky 不愿將所有豆子都灑在產(chǎn)品上,但確實(shí)告訴我們,它將使用 Celestial 的硅光子學(xué)中介層技術(shù)作為 HBM,互連和控制器邏輯之間的接口。

說(shuō)到模塊的控制器,我們被告知 5nm 開(kāi)關(guān) ASIC 有效地將 HBM 變成 DDR5 的直寫(xiě)緩存?!杆鼮槟峁┝?DDR 的容量和成本以及帶寬和 HBM 互連的 32 個(gè)偽通道的所有優(yōu)勢,從而隱藏了延遲,」Lazovsky 解釋道。

他補充說(shuō),這與英特爾對至強 Max 所做的或英偉達對其 GH200 超級芯片所做的事情相去不遠?!杆旧鲜且粋€(gè)增壓的 Grace-Hopper,沒(méi)有所有的成本開(kāi)銷(xiāo),而且效率更高?!?/p>

效率提高多少?「我們的內存事務(wù)能量開(kāi)銷(xiāo)約為每比特 6.2 皮焦耳,而通過(guò) NVLink、NVSwitch 進(jìn)行遠程內存事務(wù)的開(kāi)銷(xiāo)約為 62.5 皮焦耳,」Lazovsky 稱(chēng),并補充說(shuō)延遲也不高。

「這些遠程內存事務(wù)的總往返延遲,包括通過(guò)光子結構的兩次旅行和內存讀取時(shí)間,為 120 納秒,」他補充道:「因此,它將比大約 80 納秒的本地內存多一點(diǎn),但它比去 Grace 并讀取參數并將其拉到 Hopper 要快?!?/p>

據我們了解,這些內存模塊中的 16 個(gè)可以嚙合并為一個(gè)內存交換機,并且可以使用光纖隨機播放連接多個(gè)這些設備。

這意味著(zhù),除了計算、存儲和管理網(wǎng)絡(luò )之外,使用 Celestial 互連構建的芯片不僅能夠相互連接,而且能夠共享內存池。

「這允許你以一種非常非常有效的方式進(jìn)行機器學(xué)習操作,例如廣播和減少,而無(wú)需切換,」Lazovsky 說(shuō)。

Celestial 面臨的挑戰是時(shí)機。Lazovsky 告訴我們,他預計將在 2025 年下半年的某個(gè)時(shí)候開(kāi)始向客戶(hù)提供光子織物小芯片的樣品。然后,他預計至少還需要一年時(shí)間,我們才能看到使用該設計的產(chǎn)品投放市場(chǎng),并在 2027 年實(shí)現銷(xiāo)量增長(cháng)。

然而,Celestial 并不是唯一一家追求硅光子學(xué)的初創(chuàng )公司。另一家獲得英特爾投資支持的光子學(xué)初創(chuàng )公司 Ayar Labs 已經(jīng)將其光子學(xué)互連集成到原型加速器中。

然后是 Lightmatter,它在去年 12 月獲得了 1.55 億美元的 C 輪融資,并試圖通過(guò)其 Passage 中介層做一些與 Celestial 非常相似的事情。當時(shí),Lightmatter 首席執行官尼克·哈里斯(Nick Harris)聲稱(chēng),它有客戶(hù)使用 Passage 來(lái)「擴展到 300,000 臺節點(diǎn)的超級計算機」。當然,和拉佐夫斯基一樣,哈里斯也不會(huì )告訴我們它的客戶(hù)是誰(shuí)。

還有 Eliyan,它正試圖通過(guò)其 NuLink PHY 完全擺脫中介層——或者如果你必須擁有它們,可以提高中介層的性能和規模。

無(wú)論誰(shuí)在這場(chǎng)競賽中脫穎而出,向共封裝光學(xué)器件和硅光子中介層的轉變似乎只是時(shí)間問(wèn)題。



關(guān)鍵詞: 小芯片

評論


技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>