<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > 英偉達推出開(kāi)源推理軟件Dynamo 為AI工廠(chǎng)降本增效

英偉達推出開(kāi)源推理軟件Dynamo 為AI工廠(chǎng)降本增效

作者：時(shí)間：2025-03-19 來(lái)源：網(wǎng)易科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

3月19日消息，英偉達在2025GTC大會(huì )上推出了開(kāi)源推理軟件 NVIDIA Dynamo，旨在以高效率、低成本加速并擴展 AI 工廠(chǎng)中的 AI 推理模型。

本文引用地址：http://dyxdggzs.com/article/202503/468317.htm

據介紹，NVIDIA Dynamo 是一款全新的 AI 推理服務(wù)軟件，旨在為部署推理 AI 模型的 AI 工廠(chǎng)最大化其 token 收益。它協(xié)調并加速數千個(gè) GPU 之間的推理通信，并使用分離服務(wù)將大語(yǔ)言模型 (LLM) 的處理階段和生成階段在不同 GPU 上分離開(kāi)來(lái)。這使得每個(gè)階段的特定需求可以進(jìn)行單獨優(yōu)化，并確保更大程度地利用 GPU 資源。

“全世界各行業(yè)都在訓練 AI 模型以不同的方式進(jìn)行思考和學(xué)習，從而使模型復雜度持續升級?！盢VIDIA 創(chuàng )始人兼首席執行官黃仁勛表示，“為了實(shí)現自定義推理 AI 的未來(lái)，NVIDIA Dynamo 可以在這些模型上進(jìn)行規?；渴?，從而為 AI 工廠(chǎng)實(shí)現降本增效”。

在 GPU 數量相同的情況下，Dynamo 可將 NVIDIA Hopper? 平臺上運行 Llama 模型的 AI 工廠(chǎng)性能和收益翻倍。在由 GB200 NVL72機架組成的大型集群上運行 DeepSeek-R1模型時(shí)，NVIDIA Dynamo 的智能推理優(yōu)化也可將每個(gè) GPU 生成的 token 數量提高30倍以上。

NVIDIA Dynamo 完全開(kāi)源并支持 PyTorch、SGLang、NVIDIA TensorRT?-LLM 和 vLLM，使企業(yè)、初創(chuàng )公司和研究人員能夠開(kāi)發(fā)和優(yōu)化在分離推理時(shí)部署 AI 模型的方法。

這將使用戶(hù)加速采用 AI 推理，包括亞馬遜云科技、Cohere、CoreWeave、戴爾科技、Fireworks、谷歌云、Lambda、Meta、微軟 Azure、Nebius、NetApp、OCI、Perplexity、Together AI 和 VAST。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 英偉達 開(kāi)源 推理軟件 Dynamo AI工廠(chǎng) NVIDIA Dynamo GTC

評論

相關(guān)推薦

開(kāi)源小四軸資料.zip

資源下載開(kāi)源四軸資料 | 2013-09-23

IC設計業(yè)開(kāi)始出現明顯兩極分化

EDA/PCB TrendForce IC設計英偉達 | 2025-03-18

英偉達發(fā)表硅光子網(wǎng)絡(luò )交換器，采臺積電COUPE封裝技術(shù)

網(wǎng)絡(luò )與存儲英偉達硅光子網(wǎng)絡(luò )交換器臺積電 COUPE 封裝技術(shù) | 2025-03-19

[開(kāi)源] UML State machine Wizard 6.1

stan2005 | 2005-08-14

較勁英偉達 AMD消費型產(chǎn)品急起直追

消費電子英偉達 AMD CPU | 2025-03-18

2005中國軟件技術(shù)大會(huì )

麥莎就是我 | 2005-11-18

NVIDIA發(fā)布超級手機基于Tegra平臺

視頻 NVIDIA 手機 | 2011-01-20

大嘴業(yè)話(huà)——ARM再次上市，究竟7年時(shí)間算不算被偷走的？（1）

視頻英偉達嵌入式 ARM 軟銀 | 2023-11-06

黃仁勛宣布新一代AI芯片英偉達Rubin芯片，明年下半年推出

智能計算英偉達 AI芯片 Vera Rubin GTC | 2025-03-19

一個(gè)自己制作u盤(pán)的開(kāi)源項目 - www.lumit.org

lumit | 2004-08-27

Nvidia DRIVE AGX Xavier上的ADI成像雷達

視頻 ADI Nvidia DRIVE AGX | 2020-06-12

一個(gè)自己制作u盤(pán)的開(kāi)源項目 - www.lumit.org

lumit | 2004-08-27

英偉達宣布與通用汽車(chē)合作打造下一代汽車(chē)、工廠(chǎng)和機器人

機器人英偉達通用汽車(chē) 汽車(chē) 工廠(chǎng) 機器人 | 2025-03-19

開(kāi)源的 JAIN-SLEE SIP 軟交換 -- Mobic...

資源下載開(kāi)源 JAIN-SLEE 軟交 Mobicents | 2013-09-18

大嘴業(yè)話(huà)——ARM再次上市，究竟7年時(shí)間算不算被偷走的？（2）

視頻 AI 英偉達 ARM | 2023-11-07

消息稱(chēng) SK 海力士將獨家供應英偉達 12 層 HBM3E 芯片

網(wǎng)絡(luò )與存儲 SK 海力士英偉達 HBM3E 芯片 | 2025-03-18

Nvidia MCP55P Desige guide

資源下載 Nvidia MCP55P Desige guide | 2013-09-18

英偉達推出開(kāi)源推理軟件Dynamo 為AI工廠(chǎng)降本增效

智能計算英偉達開(kāi)源推理軟件 Dynamo AI工廠(chǎng) NVIDIA Dynamo GTC | 2025-03-19

英偉達GTC大會(huì )關(guān)鍵亮點(diǎn)看過(guò)來(lái)

智能計算英偉達 GTC | 2025-03-18

外媒評黃仁勛演講：缺少重磅利好沒(méi)能刺激股價(jià)

智能計算外媒黃仁勛股價(jià) 英偉達 GTC 個(gè)人AI超算 DeepSeek Rubin | 2025-03-19

NVIDIA獲ARM授權，為圖形處理器增添應用處理功能

xiaosongs | 2005-10-19

大嘴業(yè)話(huà)——英偉達宣布進(jìn)軍CPU市場(chǎng)

視頻英偉達 AI CPU | 2023-11-10

ARM.新聞稿

資源下載 Zilog ARM 32位微控制器嵌入式 MCU SoC Cortex-M3 多核處理器消費電子 Mali-400 MP NVIDIA Tegra 高度優(yōu)化下一代機頂盒納米片上系統 | 2009-04-12

開(kāi)源1000款嵌入開(kāi)發(fā)板資料光盤(pán)免費下載地址---非常難得

資源下載開(kāi)源嵌入光盤(pán) 免費下載地址 | 2013-10-03

英偉達正式發(fā)布Blackwell Ultra，黃仁勛預告下一代超級芯片

智能計算英偉達 Blackwell Ultra 黃仁勛 | 2025-03-19

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>