DPU:2023的洪荒之力
日前,華為輪值董事長(cháng)胡厚崑說(shuō)道,科技革命經(jīng)過(guò)了數次浪潮,從互聯(lián)網(wǎng)到移動(dòng)化到云計算、到人工智能,每一輪的變革都給社會(huì )帶來(lái)了深遠的影響。毫無(wú)疑問(wèn),今天通用人工智能(AI)正給我們無(wú)窮的想象空間,也正帶領(lǐng)我們走進(jìn)下一個(gè)黃金十年。
本文引用地址:http://dyxdggzs.com/article/202307/448786.htm當前,人工智能、大數據應用進(jìn)入快速發(fā)展階段,自動(dòng)駕駛、機器人、AR/VR、元宇宙等應用加速落地,傳統數字基礎設施難以滿(mǎn)足大模型、多模態(tài)等新型技術(shù)發(fā)展,擁有強大集群算力的新型數據中心成為突破人工智能發(fā)展瓶頸的重要基礎。
DPU 作為突破數據流量指數級增長(cháng)帶來(lái)的性能瓶頸的關(guān)鍵技術(shù),通過(guò)算力卸載、算力釋放和算力拓展,釋放 CPU 的計算資源,實(shí)現任務(wù)加速處理,提升整體計算效率,達到降本增效,產(chǎn)業(yè)賦能價(jià)值凸顯。因此,也成為構建新型算力基礎設施的重要基礎部件和下一代芯片技術(shù)競爭的高地。
DPU 也被預測為 2023 年的十大科技趨勢之一,這份「洪荒之力」發(fā)展的如何呢?
「新貴」是怎樣練成的
有人說(shuō),DPU 將成為未來(lái)計算的三大支柱之一,未來(lái)的數據中心標配是:CPU + DPU + GPU。
DPU 最直接的作用是作為 CPU 的卸載(offload)引擎,其效果是給 CPU「減負」?!禗PU 技術(shù)白皮書(shū)》主編、中科院計算所研究員鄢貴海作了一個(gè)形象比喻,說(shuō) DPU 提供了數據中心一把「殺雞」的工具,節省的是 CPU 這把「牛刀」,以釋放 CPU 算力,留給更需要它的業(yè)務(wù)負載。這個(gè)比喻也形象地說(shuō)明了 DPU 這個(gè)新貴的定位。
DPU 通過(guò)執行以下主要功能為現代數據中心帶來(lái)許多好處:
一、提高處理能力: DPU 減輕 CPU 的網(wǎng)絡(luò )和通信工作負載,從而釋放資源用于應用程序處理。
二、提高效率和性能: 通過(guò)將處理核心與硬件加速器塊相結合來(lái)大規模處理以數據為中心的工作負載,DPU 可以提高性能并減少延遲。
三、處理復雜任務(wù)的能力: DPU 旨在處理大型數據中心中的數據密集型工作負載,支持云環(huán)境或驅動(dòng)人工智能、深度學(xué)習算法和其他數據密集型應用的超級計算機。
四、能夠滿(mǎn)足數據中心不斷增長(cháng)的需求: 隨著(zhù)數據中心需求的增長(cháng)和變得更加密集,DPU 可以進(jìn)行擴展,以適應數量和復雜性不斷增加的工作負載。此外,DPU 可以添加到現有的硬件基礎設施中,從而實(shí)現靈活且適應性強的數據中心架構。
五、提高可靠性和可用性: DPU 可以通過(guò)冗余和高可用性等功能提供更高的可靠性,確保在發(fā)生硬件故障時(shí)關(guān)鍵數據處理任務(wù)的連續性。
六、降低成本: DPU 可以通過(guò)從 CPU 卸載處理任務(wù)并處理復雜任務(wù)來(lái)降低與管理數據中心相關(guān)的總體硬件成本,從而需要更少的硬件組件。
DPU、CPU 和 GPU 之間有什么區別呢?
首先在功能上,DPU(數據處理單元)、CPU(中央處理單元)和 GPU(圖形處理單元)都是計算處理器,各自執行不同的功能。CPU 是負責計算機系統整體運行的主處理器,是計算機的「大腦」。GPU 是用于圖形計算任務(wù)(例如渲染 3D 圖像或視頻)的專(zhuān)用處理器。DPU 是最新的處理器,專(zhuān)門(mén)用于以數據為中心的工作負載,例如數據中心的網(wǎng)絡(luò )、存儲和安全操作。
其次是架構,CPU 由幾個(gè)強大的處理核心組成,這些核心針對串行或順序處理進(jìn)行了優(yōu)化,這意味著(zhù)一項又一項任務(wù)。GPU 具有大量針對并行處理(即同時(shí)執行任務(wù))進(jìn)行優(yōu)化的更簡(jiǎn)單的內核。DPU 結合了處理核心、硬件加速器塊和高性能網(wǎng)絡(luò )接口,可大規模處理以數據為中心的任務(wù)。
另外,CPU 幾乎用于所有計算機設備,從智能手機到計算機再到服務(wù)器。GPU 經(jīng)常用于游戲電腦。DPU 主要用于數據中心。
基于明顯的優(yōu)勢,國外大廠(chǎng)已經(jīng)早早地開(kāi)始發(fā)展 DPU 了。
2019 年,英偉達以 69 億美元的價(jià)格收購以色列網(wǎng)絡(luò )芯片公司 Mellanox,并于同年推出 BlueField-2 DPU,自此拉開(kāi) DPU 高速發(fā)展的序幕。
在 2020 年 GPU 技術(shù)大會(huì )上,英偉達首席執行官黃仁勛推出了名為 BlueField-2 數據處理單元 (DPU) 的全新處理器系列。開(kāi)發(fā)人員可以通過(guò)軟件平臺 DOCA SDK 訪(fǎng)問(wèn) DPU。DPU 和 DOCA SDK 可與英偉達 GPU 硬件和 CUDA 軟件的強大組合相媲美。
7 月 11 日業(yè)內四名知情人士報道,歐盟監管機構將于本周三批準博通以 690 億美元收購軟件制造商 VMware 的交易。報道稱(chēng),歐盟委員會(huì )將接受博通的讓步,即 VMware 的軟件將繼續與競爭對手的硬件兼容。知情人士表示,這一舉措已被證明足以解決歐盟競爭監管機構的擔憂(yōu),而無(wú)需博通出售 VMware 的部分業(yè)務(wù)。
這次的收購如果成功,博通就可以進(jìn)一步進(jìn)軍數據中心市場(chǎng),特別是數據處理單元(DPU)市場(chǎng),也稱(chēng)為智能網(wǎng)絡(luò )接口卡(smartNIC)市場(chǎng)。VMware 也一直在尋找自己的 DPU/smartNIC 市場(chǎng)之路。自 2020 年以來(lái),該公司一直致力于一項名為 Project Monterey 的項目,研究其虛擬化軟件如何與 DPU 配合使用。
2022 年 3 月,高級技術(shù)營(yíng)銷(xiāo)架構師 Dave Morera 對該項目的描述是:「根據 VMware 的蒙特利項目,網(wǎng)絡(luò )流量、分布式防火墻等網(wǎng)絡(luò )進(jìn)程將被卸載到 SmartNIC(智能網(wǎng)絡(luò )接口卡);這意味著(zhù)不僅 x86 服務(wù)器的資源被繞過(guò),流量本身也被繞過(guò)。蒙特利項目還將促進(jìn)在 DPU 本身上安裝 ESXi 和 NSX,從而將所需的 CPU 資源從 x86 卸載到 DPU,不僅釋放 x86 上的資源供虛擬機使用,而且還提供額外的安全層」。
除了英偉達之外,下表展示了其他國際廠(chǎng)商的 DPU 產(chǎn)品
國內 DPU 起勢猛
雖然國內廠(chǎng)商在芯片產(chǎn)品化的環(huán)節與國外一線(xiàn)廠(chǎng)商相比還有差距,但是在 DPU 架構的理解上還是有獨到的見(jiàn)解的,而且我國目前在數據中心這個(gè)領(lǐng)域,無(wú)論是市場(chǎng)規模還是增速,特別是用戶(hù)數量,相較于國外都有巨大的優(yōu)勢。國內廠(chǎng)商有望充分利用這一市場(chǎng)優(yōu)勢,加快發(fā)展步伐,在 DPU 這個(gè)賽道與國外廠(chǎng)商逐鹿中原。
國內廠(chǎng)商在啃的是一塊新的「硬骨頭」。DPU 技術(shù)的特點(diǎn)是燒錢(qián)多、周期長(cháng)、產(chǎn)品面向政企、很難快速上量, 但是技術(shù)壁壘高、客戶(hù)黏性強。同時(shí), DPU 是全球新近發(fā)展起來(lái)的一項新技術(shù), 不像很多成熟芯片已經(jīng)形成了「西強東弱」的格局, 在 DPU 上中國和西方國家沒(méi)有代際差。
也就是說(shuō) DPU 是全球新近發(fā)展起來(lái)的一種專(zhuān)用處理器。國內廠(chǎng)商的一些產(chǎn)品處在從小批量到規?;瘧玫碾A段, 已經(jīng)有了第一批客戶(hù)。當下的任務(wù)是, 保持產(chǎn)品迭代以適應用戶(hù)需求。同時(shí), 推動(dòng)產(chǎn)品從小批量到規?;涞? 再要考慮如何去復制同類(lèi)客戶(hù)。
然而 DPU 產(chǎn)業(yè)化的挑戰很大, 這包括一些供應鏈緊張、人才不足的共性難題, 還有需求碎片化、大量兼容適配的特殊挑戰, 目前單顆 DPU 成本較高。
與存儲器、CPU 這種成熟產(chǎn)品不同, 這些芯片已經(jīng)被標準化,國際大廠(chǎng)擁有技術(shù)的、成本的優(yōu)勢, 并善于利用產(chǎn)品的周期性調整價(jià)格, 以驅逐追趕者。國產(chǎn)的道路是后發(fā)追趕式的, 面臨的競爭非常殘酷。
DPU 未來(lái)也會(huì )走向標準化。中科馭數公司的創(chuàng )始人兼 CEO 鄢貴海說(shuō):「我們感受到的競爭氛圍更寬松, 而且創(chuàng )新的空間更大, 比如我們正在研究如何將端到端的延遲從 20 微秒降低到 2 微秒, 對于很多技術(shù)點(diǎn), 各家都有不同的實(shí)現方法, 但若這項技術(shù)在國際上已經(jīng)相對成熟, 那國產(chǎn)幾乎沒(méi)有空間去創(chuàng )新了, 最緊要的任務(wù)就是趕上國際的水平, 做出一個(gè)自主可控的方案?!?/span>
在全球格局尚未形成之前, 國產(chǎn) DPU 需要利用國內的資源稟賦和更多國產(chǎn)芯片達成生態(tài)協(xié)同, 并服務(wù)于本土的信息基礎設施, 在全球角逐一項新技術(shù)的關(guān)鍵窗口期, 探索出一種「中國方案」。
其中「定制化方案」就是國產(chǎn) DPU 很好的發(fā)展方向和布局思路。DPU 是個(gè)新興市場(chǎng),客戶(hù)需求還處于粗放階段,各種方案都有適合的應用場(chǎng)景。因為玩家不多,客戶(hù)需求比較分散,單個(gè)廠(chǎng)商無(wú)法服務(wù)眾多客戶(hù),因此現階段都能夠通過(guò)為客戶(hù)進(jìn)行定制化服務(wù)獲得訂單。
國內未來(lái) DPU 的發(fā)展和布局應采取一些差異化競爭思路,一方面,加快自主研發(fā) DPU 的進(jìn)程。不管是處理器架構的研發(fā),還是網(wǎng)絡(luò )芯片的研發(fā),都要加快產(chǎn)品的迭代速度。另一方面,在商業(yè)模式上,找一些細分的產(chǎn)品角度進(jìn)行創(chuàng )新。多與國內的云計算、數據中心的廠(chǎng)商合作,先進(jìn)行小批量的產(chǎn)品鋪設,再進(jìn)行大規模的布局。
評論