<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 業(yè)界動(dòng)態(tài) > AI業(yè)界，全球最大16核心GPU原理剖析

AI業(yè)界，全球最大16核心GPU原理剖析

作者：時(shí)間：2018-08-22 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

編者按：前不久，一款超級計算機的發(fā)布，讓人嘩然，人們震驚的是其擁有16顆Volta GPU所展現的強大的計算能力，16核GPU可提供高達2PFLOPS的深度學(xué)習計算能力，成為目前AI業(yè)界的最強者。

　　隨著(zhù)AI市場(chǎng)的興起，近年來(lái)各業(yè)界精英在GPU上持續發(fā)力，不斷推出全新的產(chǎn)品。新產(chǎn)品在計算能力提升的同時(shí)，其芯片面積也已經(jīng)屢創(chuàng )新高，甚至逼近了制程和成本的平衡極限。前不久，一款超級計算機的發(fā)布，讓人嘩然，人們震驚的是其擁有16顆Volta GPU所展現的強大的計算能力，16核GPU可提供高達2PFLOPS的深度學(xué)習計算能力，成為目前AI業(yè)界的最強者。

本文引用地址：http://dyxdggzs.com/article/201808/390897.htm

　　這16顆Tesla V100的GPU連接在一起，并發(fā)揮出如此強大的計算能力的的核心當屬NVLink 2和NVSwitch。

　　1、NVLINK

　　隨著(zhù)開(kāi)發(fā)人員在人工智能(AI)計算等應用領(lǐng)域中越來(lái)越依賴(lài)并行結構，各行各業(yè)中的多GPU 和多CPU系統愈發(fā)普及。其中包括采用PCIe系統互聯(lián)技術(shù)的4GPU和8GPU系統配置來(lái)解決非常復雜的重大難題。然而，在多 GPU系統層面，PCIe帶寬逐漸成為瓶頸，這就需要更快速和更具擴展性的多處理器互聯(lián)技術(shù)。

　　a、更快速、更具可擴展性的互聯(lián)技術(shù)

　　NVLink技術(shù)可以提供更高帶寬與更多鏈路，并可提升多GPU和多GPU/CPU系統配置的可擴展性，因而可以解決這種互聯(lián)問(wèn)題。通過(guò)提高可擴展性，進(jìn)而實(shí)現超快速的深度學(xué)習訓練。

　　NVLink技術(shù)首先將每個(gè)方向的信號發(fā)送速率從20GB/每秒增加到25GB/每秒。含此技術(shù)的產(chǎn)品可用于GPU至CPU或GPU至GPU的通信。

　　b、3層控制層，能更大限度提高系統吞吐量

　　NVLink控制器由3層組成，即物理層(PHY)、數據鏈路層(DL)以及交易層(TL)。下圖展示了P100 NVLink 1.0的各層和鏈路：

　　P100搭載的NVLink 1.0，每個(gè)P100有4個(gè)NVLink通道，每個(gè)擁有40GB/s的雙向帶寬，每個(gè)P100可以最大達到160GB/s帶寬。

　　V100搭載的NVLink 2.0，每個(gè)V100增加了50%的NVLink通道達到6個(gè)，信號速度提升28%使得每個(gè)通道達到50G的雙向帶寬，因而每個(gè)V100可以最大達到300GB/s的帶寬。

　　下圖是HGX-1/DGX-1使用的8個(gè)V100的混合立方網(wǎng)格拓撲結構，雖然V100有6個(gè)NVlink通道，但是實(shí)際上因為無(wú)法做到全連接，2個(gè)GPU間最多只能有2個(gè)NVLink通道100G/s的雙向帶寬。而GPU與CPU間通信仍然使用PCIe總線(xiàn)。CPU間通信使用QPI總線(xiàn)。這個(gè)拓撲雖然有一定局限性，但依然大幅提升了同一CPU Node和跨CPU Node的GPU間通信帶寬。

　　2、NVSwitch

　　a、拓撲擴展實(shí)現完全連接的NVLINK

　　類(lèi)似于PCIe使用PCIe Switch用于拓撲的擴展，使用NVSwitch實(shí)現了NVLink的全連接。NVSwitch作為首款節點(diǎn)交換架構，可支持單個(gè)服務(wù)器節點(diǎn)中16個(gè)全互聯(lián)的GPU，并可使全部8個(gè)GPU對分別以 300GB/s 的驚人速度進(jìn)行同時(shí)通信。這16個(gè)全互聯(lián)的GPU(32G顯存V100)還可作為單個(gè)大型加速器，擁有 0.5TB統一顯存空間和2PetaFLOPS 計算性能。

　　由于PCIe 帶寬日益成為多GPU系統級別的瓶頸，深度學(xué)習工作負載的快速增長(cháng)使得對更快速、更可擴展的互連的需求逐漸增加。

　　NVLink實(shí)現了很大的進(jìn)步，可以在單個(gè)服務(wù)器中支持八個(gè)GPU，并且可提升性能，使之超越 PCIe。但是，要將深度學(xué)習性能提升到一個(gè)更高水平，將需要使用GPU 架構，該架構在一臺服務(wù)器上支持更多的GPU以及GPU之間的全帶寬連接。

　　b、首款節點(diǎn)交換架構，加速深度學(xué)習和高性能計算

　　NVIDIA NVSwitch 是首款節點(diǎn)交換架構，可支持單個(gè)服務(wù)器節點(diǎn)中16個(gè)全互聯(lián)的GPU，并可使全部8個(gè)GPU 對分別以300GB/s 的驚人速度進(jìn)行同時(shí)通信。這16個(gè)全互聯(lián)的GPU還可作為單個(gè)大型加速器，擁有0.5TB統一顯存空間和2PetaFLOPS計算性能。

　　NVIDIA NVLink將采用相同配置的服務(wù)器性能提高31%。使用NVSwitch的DGX-2則能夠達到2倍以上的深度學(xué)習和高性能計算的加速。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI GPU NVLINK

評論

相關(guān)推薦

加大調整力度，教育部支持高校布局集成電路、AI 等專(zhuān)業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

大嘴業(yè)話(huà)：A12真的能改變競爭格局么？

視頻 ARM A12 GPU | 2013-06-21

醫療電子平臺選擇:FPGA、ARM、X86、DSP還是GPU分析

設計方案 FPGA ARM DSP GPU X | 2015-08-13

HBM4持續加速：AI時(shí)代競爭新焦點(diǎn)

網(wǎng)絡(luò )與存儲 HBM AI 內存 | 2024-07-25

GPU圖形處理器各大廠(chǎng)家芯片參數介紹

資源下載 GPU 芯片 | 2013-08-30

萬(wàn)家樂(lè )JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬(wàn)家樂(lè ) | 2013-01-17

消息稱(chēng) OpenAI 公司 2024 年資金缺口達到 50 億美元

智能計算 OpenAI ChatGPT AI | 2024-07-25

Intel 收購 NVDIA 意欲何為

視頻 Intel NVDIA CPU GPU 移動(dòng)處理 | 2012-12-26

繼上次海聯(lián)達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

基于GPU的數字圖像并行處理研究

設計方案圖像處理算法并行流處理 GPU | 2015-08-13

Meta訓練Llama 3遭遇頻繁故障

智能計算 Meta Llama 3 英偉達 H100 顯卡 GPU | 2024-07-29

Manpower代招上海 US MNC GPU Physical design technical leader

魔都獵頭招聘 | 2013-07-23

“破局AI開(kāi)發(fā)，釋放邊緣算力開(kāi)發(fā)者訪(fǎng)談”，干貨滿(mǎn)滿(mǎn)！

視頻 intel AI OpenVINO | 2021-06-10

CPU與GPU：誰(shuí)將主導下一次計算革命？

資源下載 CPU GPU 計算革命融合集成 SOC | 2008-05-26

gpu_gpu是什么意思

dolphin | 2014-06-12

這顆芯片有故事，你有酒嗎？

FPGAwuhan | 2016-08-20

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來(lái)頭？

視頻 AI 機器人 | 2021-02-26

摩根士丹利：僅 GB200 AI 服務(wù)器業(yè)務(wù)，就為英偉達創(chuàng )造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

消息稱(chēng)英偉達 RTX 4070 及以上顯卡因 GDDR6X 顯存缺貨 8 月供應緊張

消費電子英偉達 GPU | 2024-07-29

AI 芯片：一場(chǎng)燒錢(qián)的瘋狂競賽

智能計算 AI 芯片 | 2024-07-24

Meta發(fā)布“前沿級”開(kāi)源AI模型扎克伯格：不怕競爭者使用

智能計算 Meta 開(kāi)源 AI 模型扎克伯格 | 2024-07-24

海聯(lián)達（Aigale）Ai-HD1 無(wú)線(xiàn)全高清套件拆解

zhuwei0710 | 2013-04-28

LabVIEW和GPU用于實(shí)時(shí)高性能運算系統

資源下載 NI LabVIEW GPU | 2013-03-29

WTC-AI型太陽(yáng)能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽(yáng)能熱水器電路熱水器 | 2012-07-30

國際奧委會(huì )：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會(huì ) 體育 | 2024-07-26

AI驅動(dòng)的嵌入式聲音和振動(dòng)識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

WTC-AI太陽(yáng)能熱水器電路圖

設計方案 WTC-AI 太陽(yáng)能熱水器電路圖 | 2012-07-24

AI當靠山軟件大廠(chǎng)SAP裁員擴大至上萬(wàn)

智能計算 AI 軟件 SAP 裁員 | 2024-07-24

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>