UALink規范推出打響撼動(dòng)英偉達AI統治的第一槍
UALink 的主要目標之一是為 AI 加速器提供有競爭力的連接生態(tài)系統,該技術(shù)將與 Nvidia 成熟的 NVLink 技術(shù)相媲美,該技術(shù)使這家綠色公司能夠構建機架級 AI 優(yōu)化解決方案,例如 Blackwell NVL72。隨著(zhù) UALink 1.0 的出現,AMD、Broadcom、Google 和 Intel 等公司也將能夠使用行業(yè)標準技術(shù)而不是 Nvidia 的專(zhuān)有解決方案來(lái)構建類(lèi)似的解決方案,這意味著(zhù)成本更低。
Ultra Accelerator Link Consortium 周二正式發(fā)布了最終的 UALink 1.0 規范,這意味著(zhù)該小組的成員現在可以繼續對支持新技術(shù)的實(shí)際芯片進(jìn)行流片。新的互連技術(shù)面向 AI 和 HPC 加速器,并得到包括 AMD、Apple、Broadcom 和 Intel 在內的眾多行業(yè)參與者的支持。它有望成為連接此類(lèi)硬件的事實(shí)標準。
UALink 1.0 規范為加速器定義了高速、低延遲的互連,支持每通道 200 GT/s 的最大雙向數據速率,信號速率為 212.5 GT/s,以適應前向糾錯和編碼開(kāi)銷(xiāo)。UALink 可以配置為 x1、x2 或 x4,四通道鏈路在發(fā)射和接收方向上都能實(shí)現高達 800 GT/s。
一個(gè) UALink 系統支持多達 1,024 個(gè)加速器(GPU 或其他),通過(guò) UALink 交換機連接,每個(gè)加速器分配一個(gè)端口和一個(gè) 10 位唯一標識符,以實(shí)現精確路由。UALink 電纜長(cháng)度針對 <4 米進(jìn)行了優(yōu)化,可在 64B/640B 有效載荷下實(shí)現 <1 μs 的往返延遲。這些鏈路支持跨 1 到 4 個(gè)機架的確定性性能。
(圖片來(lái)源:UALink)
UALink 協(xié)議棧包括四個(gè)硬件優(yōu)化層:物理層、數據鏈路層、事務(wù)層和協(xié)議層。物理層使用標準以太網(wǎng)組件(例如 200GBASE-KR1/CR1),并包括使用 FEC 減少延遲的修改。數據鏈路層將來(lái)自事務(wù)層的 64 字節 fit 打包成 640 字節的單元,應用 CRC 和可選的重試邏輯。此層還處理設備間消息傳遞,并支持 UART 樣式的固件通信。
事務(wù)層實(shí)現壓縮尋址,在實(shí)際工作負載下以高達 95% 的協(xié)議效率簡(jiǎn)化數據傳輸。它還支持直接內存作,例如加速器之間的讀取、寫(xiě)入和原子事務(wù),從而保持本地和遠程內存空間的順序。
由于 UALink 協(xié)議針對現代數據中心,因此支持集成的安全和管理功能。例如,UALinkSec 為所有流量提供硬件級加密和身份驗證,防止物理篡改,并通過(guò)租戶(hù)控制的可信執行環(huán)境(如 AMD SEV、Arm CCA 和 Intel TDX)支持機密計算。該規范允許虛擬 Pod 分區,其中加速器組通過(guò)交換機級配置在單個(gè) Pod 中隔離,以在共享基礎設施上啟用并發(fā)多租戶(hù)工作負載。
UALink Pods 將通過(guò)專(zhuān)用控制軟件和固件代理使用 PCIe 和以太網(wǎng)等標準接口進(jìn)行管理。通過(guò) REST API、遙測、工作負載控制和故障隔離支持完全可管理性。
UALink 聯(lián)盟主席 Peter Onufryk 表示:“隨著(zhù) UALink 200G 1.0 規范的發(fā)布,UALink 聯(lián)盟的成員公司正在積極構建一個(gè)用于縱向擴展加速器連接的開(kāi)放生態(tài)系統。我們很高興見(jiàn)證即將進(jìn)入市場(chǎng)并支持未來(lái) AI 應用的各種解決方案。
Nvidia 目前在 AI 加速器市場(chǎng)占據主導地位,這要歸功于其強大的生態(tài)系統和縱向擴展解決方案。它目前正在發(fā)貨 Blackwell NVL72 機架,這些機架使用 NVLink 在單個(gè)機架中連接多達 72 個(gè) GPU,機架間 Pod 允許在單個(gè) Pod 中連接多達 576 個(gè) Blackwell B200 GPU。隨著(zhù)明年即將推出的 Vera Rubin 平臺,Nvidia 打算在單個(gè)機架中擴展到 144 個(gè) GPU,而 Rubin Ultra 將在 2027 年擴展到單個(gè)機架中高達 576 個(gè) GPU。
評論