<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 英偉達打臉AMD：H100在軟件加持下，AI性能比MI300X快47%！

英偉達打臉AMD：H100在軟件加持下，AI性能比MI300X快47%！

發(fā)布人：芯智訊時(shí)間：2023-12-23 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

12月14日消息，AMD于本月初推出了其最強的AI芯片Instinct MI300X，其8-GPU服務(wù)器的AI性能比英偉達H100 8-GPU高出了60%。對此，英偉達于近日發(fā)布了一組最新的H100與MI300X的性能對比數據，展示了H100如何使用正確的軟件提供比MI300X更快的AI性能。

根據AMD此前公布的數據顯示，MI300X的FP8/FP16性能都達到了英偉達（NVIDIA）H100的1.3倍，運行Llama 2 70B和FlashAttention 2 模型的速度比H100均快了20%。在8v8 服務(wù)器中，運行Llama 2 70B模型，MI300X比H100快了40%；運行Bloom 176B模型，MI300X比H100快了60%。

但是，需要指出的是，AMD在將MI300X 與英偉達H100 進(jìn)行比較時(shí)，AMD使用了最新的 ROCm 6.0 套件中的優(yōu)化庫（可支持最新的計算格式，例如 FP16、Bf16 和 FP8，包括 Sparsity等），才得到了這些數字。相比之下，對于英偉達H100則并未沒(méi)有使用英偉達的 TensorRT-LLM 等優(yōu)化軟件加持情況下進(jìn)行測試。

AMD對于英偉達H100測試的隱含聲明顯示，使用vLLM v.02.2.2推理軟件和英偉達DGX H100系統，Llama 2 70B查詢(xún)的輸入序列長(cháng)度為2048，輸出序列長(cháng)度為128。

而英偉達最新公布的對于DGX H100（帶有8個(gè)NVIDIA H100 Tensor Core GPU，帶有80 GB HBM3）測試，帶有公開(kāi)的NVIDIA TensorRT LLM軟件，v0.5.0用于Batch-1，v0.6.1用于延遲閾值測量。工作量詳細信息與腳注與AMD之前的測試相同。

結果顯示，與 AMD展示的MI300X 8-GPU服務(wù)器性能相比，英偉達DGX H100 服務(wù)器在使用優(yōu)化的軟件加持后，速度提高了 2 倍多，相比 AMD MI300X 8-GPU 服務(wù)器快了47%。

DGX H100 可以在1.7 秒內處理單個(gè)推理任務(wù)。為了優(yōu)化響應時(shí)間和數據中心吞吐量，云服務(wù)為特定服務(wù)設置了固定的響應時(shí)間。這使他們能夠將多個(gè)推理請求組合成更大的“Batch”，并增加服務(wù)器每秒的總體推理次數。MLPerf 等行業(yè)標準基準測試也使用此固定響應時(shí)間指標來(lái)衡量性能。

響應時(shí)間的微小權衡可能會(huì )導致服務(wù)器可以實(shí)時(shí)處理的推理請求數量產(chǎn)生不確定因素。使用固定的 2.5 秒響應時(shí)間預算，英偉達DGX H100 服務(wù)器每秒可以處理超過(guò) 5 個(gè) Llama 2 70B 推理，而B(niǎo)atch-1每秒處理不到一個(gè)。

顯然，英偉達使用這些新的基準測試是相對公平的，畢竟AMD也使用其優(yōu)化的軟件來(lái)評估其GPU的性能，所以為什么不在測試英偉達H100時(shí)也這樣做呢？

要知道英偉達的軟件堆棧圍繞CUDA生態(tài)系統，經(jīng)過(guò)多年的努力和開(kāi)發(fā)，在人工智能市場(chǎng)擁有非常強大的地位，而AMD的ROCm 6.0是新的，尚未在現實(shí)場(chǎng)景中進(jìn)行測試。

根據AMD之前透露的信息顯示，其已經(jīng)與微軟、Meta等大公司達成了很大一部分交易，這些公司將其MI300X GPU視為英偉達H100解決方案的替代品。

AMD最新的Instinct MI300X預計將在2024年上半年大量出貨，但是，屆時(shí)英偉達更強的H200 GPU也將出貨，2024下半年英偉達還將推出新一代的Blackwell B100。另外，英特爾也將會(huì )推出其新一代的AI芯片Gaudi 3。接下來(lái)，人工智能領(lǐng)域的競爭似乎會(huì )變得更加激烈。

編輯：芯智訊-浪客劍

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 英偉達

相關(guān)推薦

在英偉達工作不容易？員工曝高壓高工時(shí)更甚臺積電

國際視野英偉達臺積電 | 2024-07-24

大嘴業(yè)話(huà)——ARM再次上市，究竟7年時(shí)間算不算被偷走的？（2）

視頻 AI 英偉達 ARM | 2023-11-07

浪潮信息回應與英偉達分銷(xiāo)中國特供B20芯片：消息不實(shí)

智能計算英偉達浪潮 B20 | 2024-07-23

【100積分限時(shí)送】Do?you?have?4?mintes?

nakey | 2021-05-24

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達創(chuàng )造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

英偉達RTX 50系顯卡延期至2025年

英偉達顯卡 AMD Intel CES | 2024-07-23

Meta訓練Llama 3遭遇頻繁故障

智能計算 Meta Llama 3 英偉達 H100 顯卡 GPU | 2024-07-29

傳英偉達曾要求建立專(zhuān)用CoWoS產(chǎn)線(xiàn)，但是被臺積電拒絕

智能計算英偉達 CoWoS 臺積電 | 2024-07-24

大嘴業(yè)話(huà)——英偉達宣布進(jìn)軍CPU市場(chǎng)

視頻英偉達 AI CPU | 2023-11-10

《E點(diǎn)冷知識》：引發(fā)AI行業(yè)大地震的CUDA究竟有多強大

視頻英偉達 GPU CUDA AI | 2024-03-26

大嘴業(yè)話(huà)——ARM再次上市，究竟7年時(shí)間算不算被偷走的？（1）

視頻英偉達嵌入式 ARM 軟銀 | 2023-11-06

消息稱(chēng)英偉達 RTX 4070 及以上顯卡因 GDDR6X 顯存缺貨 8 月供應緊張

消費電子英偉達 GPU | 2024-07-29

英偉達的挑戰者的來(lái)錢(qián)之道

智能計算英偉達大模型 | 2024-07-23

GPU的形態(tài)已徹底改變，英偉達GTC大會(huì )發(fā)布的到底是什么

視頻英偉達 GPU Blackwell AI GTC | 2024-03-26

消息稱(chēng)英偉達曾向臺積電詢(xún)問(wèn)建設廠(chǎng)外 CoWoS 先進(jìn)封裝專(zhuān)線(xiàn)可能，遭拒絕

EDA/PCB 英偉達 GPU 封裝工藝臺積電 | 2024-07-23

三星通過(guò)英偉達測試內幕：用在中國大陸產(chǎn)品

網(wǎng)絡(luò )與存儲三星英偉達 HBM3 | 2024-07-24

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>