<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 業(yè)界動(dòng)態(tài) > AMD大爆發(fā) Vega GPU架構技術(shù)要點(diǎn)總結

AMD大爆發(fā) Vega GPU架構技術(shù)要點(diǎn)總結

作者: 時(shí)間:2017-03-21 來(lái)源:微型計算機 收藏
編者按:在今年一月份的CES展會(huì )上,AMD對外披露了Vega的部分技術(shù)細節,雖然關(guān)鍵的性能指標還不得而知,但我們還是可以從下列資料中可以看出Vega所具有的巨大潛力。

  NCU:下一代計算單元,為深度學(xué)習優(yōu)化

本文引用地址:http://dyxdggzs.com/article/201703/345466.htm

  單精度和雙精度計算應用于3D渲染領(lǐng)域,但諸如深度學(xué)習等計算任務(wù)并不需要用到,它們只需16位半精度浮點(diǎn)計算操作就行。現有的 Fiji和Polaris GPU中沒(méi)有考慮到這一點(diǎn),它的半精度性能與32位單精度性能是一樣的,而半精度計算需要的寄存器資源卻少得多,也就是說(shuō)沒(méi)有對此作優(yōu)化。與之相比,英偉達的Tesla 100加速卡,半精度性能就達到雙精度的兩倍,這讓它在通用計算中占據性能優(yōu)勢。

  為此,GPU中首度引入了名為“Packed(緊縮)”的半精度計算支持,Vega的微架構被稱(chēng)為“NCU(下一代計算單元)”,每個(gè)NCU中擁有64個(gè)ALU,它可以靈活地執行緊縮數學(xué)操作指令,如每個(gè)周期可以進(jìn)行512個(gè)8位數學(xué)計算,或者256個(gè)16位計算,或者128個(gè)32位計算—這不僅充分利用了硬件資源,也大幅度提升Vega在深度學(xué)習計算的性能。

  GPU的性能推算

  Vega的架構改進(jìn),給業(yè)界帶來(lái)很大的想象力,但它的性能究竟能達到何種級別,還是存在很大的懸念。雖然基于GPU的顯卡尚未發(fā)布,但在去年12月份卻帶來(lái)一款Radeon Instinct MI25 計算卡的消息,它所搭載的就是Vega GPU芯片。

AMD大爆發(fā) Vega GPU架構技術(shù)要點(diǎn)總結

  Radeon Instinct MI25 計算卡

  Radeon Instinct MI25計算卡針對深度學(xué)習領(lǐng)域,GPU中直接集成了16GB容量的HBM2高速緩存(對應顯卡則是顯存),卡上另外還集成了1TB容量的NAND閃存,海量的計算數據可以直接放在這塊存儲器中,而不必經(jīng)過(guò)系統內存再到傳統硬盤(pán)上,由此滿(mǎn)足大計算量所需的高速交換需求。M125的16位半精度浮點(diǎn)性能達到25TFLOPS,而用于3D渲染的32位單精度浮點(diǎn)性能也達到12.5TFLOPs,與之相比,目前AMD的主力顯卡RX 480的單精度浮點(diǎn)性能只有5.8 TFLOPs—我們可以簡(jiǎn)單得出這樣的推論,Vega GPU的3D渲染性能,理論上將能達到目前RX480顯卡的兩倍左右。

  而在Radeon Instinct MI25的發(fā)布會(huì )上,AMD同樣展示了基于Vega GPU的下一代Radeon顯卡的測試成績(jì),AMD在現場(chǎng)使用《DOOM2016》進(jìn)行了演示,游戲配置為4K@60Hz分辨率、Ultra 畫(huà)面。這塊顯卡的顯存只有8GB容量,在實(shí)際測試中,游戲幀數達到60~70fps的性能,整體相當于NVIDIA的 GTX 1070、1080之間??紤]到展示卡是早期版本、規格也不高,能達到這樣的性能足以讓外界振奮,這讓我們想到圖形雙雄并立的美好時(shí)光。

  Radeon Instinct 平臺:Vega進(jìn)軍深度學(xué)習市場(chǎng)

  AMD對Vega GPU在圖形領(lǐng)域的實(shí)力秘而不宣,但在吹風(fēng)會(huì )上,它將Vega的應用重點(diǎn)更多放在機器學(xué)習領(lǐng)域。為此,AMD專(zhuān)門(mén)發(fā)布了新的AI 計算子品牌“Radeon Instinct”,該平臺包括硬件的加速卡和ROCm軟件平臺,我們前面提到的Radeon Instinct MI25計算卡就是加速卡中的旗艦型號。ROCm軟件平臺更為我們所關(guān)注。

  我們知道,NVIDIA占據通用計算市場(chǎng),除了Tesla加速卡在硬件性能方面的優(yōu)勢外,更重要的它提供了軟件解決方案,借助它的方案,開(kāi)發(fā)者能夠編制出相應的Tesla加速程序。由于Tesla在并行計算應用中比傳統的CPU優(yōu)勢巨大,方案一出就快速獲得業(yè)界的接受,并成為事實(shí)上的市場(chǎng)熱門(mén)標準,以至于英特爾都無(wú)法在密集計算市場(chǎng)與之爭鋒。NVIDIA現在將他們的GPU定位于A(yíng)I、神經(jīng)網(wǎng)絡(luò )的首選的計算平臺,并開(kāi)始轉型將自身定位于A(yíng)I計算公司,而不是單單停留在傳統的游戲顯卡市場(chǎng)。這對于A(yíng)MD顯然是非常大的刺激,現在A(yíng)MD也想在該AI計算獲得突破,那么光靠Vega平臺的硬件實(shí)力顯然不行,ROCm軟件平臺的出臺就是為了解決開(kāi)發(fā)環(huán)境支持的短板。


AMD大爆發(fā) Vega GPU架構技術(shù)要點(diǎn)總結

  Radeon Instinct兩大構成:硬件加速卡和ROCm開(kāi)發(fā)環(huán)境



關(guān)鍵詞: AMD Vega

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>