<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 業(yè)界動(dòng)態(tài) > 沐露晨曦之博大“芯”懷所望

沐露晨曦之博大“芯”懷所望

作者:鄭小龍 (《電子產(chǎn)品世界》編委) 時(shí)間:2021-06-16 來(lái)源:電子產(chǎn)品世界 收藏


本文引用地址:http://dyxdggzs.com/article/202106/426326.htm

1   智能化不斷催生智慧的芯

移動(dòng)互聯(lián)網(wǎng)及云計算技術(shù)的迅猛發(fā)展,使得算力對人們生活的方方面面產(chǎn)生深遠的影響,并且與人均GDP 具有高度相關(guān)性,因此,算力基礎設施在“新基建”中發(fā)揮著(zhù)舉足輕重的作用,而算力提供者也成為不斷推動(dòng)數字經(jīng)濟向前發(fā)展的核心引擎??商峁姶笏懔Φ氖切阅茏吭降母叨颂幚砥?,所面向的是越來(lái)越復雜的邊緣計算。根據Gartner 分析,過(guò)去5 年來(lái),全球邊緣計算復合增長(cháng)率達到87.4%,2020 年市場(chǎng)規模超過(guò)424億美元。然而,高端處理器芯片由少數國際廠(chǎng)商壟斷的格局在行業(yè)內由來(lái)已久,不過(guò)這個(gè)堅冰正在融化,燧原科技AI 云端芯片引發(fā)星火燎原[1],在通用高端處理器方面又將有誰(shuí)帶來(lái)曙光?在上海張江的騰飛科技樓,通過(guò)與沐曦集成電路有限公司創(chuàng )始人、CEO 陳維良交流,我看到了打造全球一流國產(chǎn) 芯片的希望所在。

如圖1 所示,著(zhù)眼于信息技術(shù)產(chǎn)業(yè)鏈的結構,可以看到所需的基礎是芯片層,計算芯片對算力起著(zhù)決定性作用,其中包括兩種類(lèi)型,即中央處理器CPU 和圖形處理器。CPU 作為計算機時(shí)代的核心引擎獨領(lǐng)風(fēng)騷數十年,始終是算力的主要承擔者,然而,后來(lái)至上的 以其強大并行計算能力,將計算性能和效率提到更高的水平,并對各種新算法具有很強的適應性。GPU 所具有的獨特優(yōu)勢可以同時(shí)滿(mǎn)足傳統高性能計算和新型AI 計算的需求,因而成為最重要的算力來(lái)源。

1623812965221484.png

圖1 信息技術(shù)產(chǎn)業(yè)鏈結構

主流高端GPU 分為針對通用算力的通用GPU(即General Purpose GPU,)和針對游戲顯示的傳統GPU。如圖2 所示,當前全球高性能GPU 市場(chǎng)被少數幾家國外公司壟斷,使得中國互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的大數據基礎設施受控于人,凸顯出國家安全及國計民生存在巨大不可控風(fēng)險,因此,核心算力芯片國產(chǎn)替代勢在必行。高性能GPU 的研發(fā)技術(shù)門(mén)檻非常高,具有長(cháng)期GPU 核心技術(shù)積累的全建制人才隊伍才有可能勝任。為此,作為新崛起的集成電路新生力量,沐曦肩負起重任,致力于以中國人智慧創(chuàng )造出滿(mǎn)足中國智能化社會(huì )需要的先進(jìn)GPU 芯片,而解決困擾我國高性能GPU 供應鏈安全的問(wèn)題,為算力經(jīng)濟提供強有力的支撐。

image.png

圖2 主流的高端GPU及其所占據市場(chǎng)

2   異構化成就超酷的芯

作為行業(yè)資深的高端處理器設計專(zhuān)家,陳維良談到,要改變以往以CPU 作為算力核心的手段,就是要采用“異構”體系,就是CPU 加上比其能效更高的計算單元。異構計算的興起標志著(zhù)“摩爾定律”對于高性能計算芯片已不再完全適用,一方面,CPU 處理器性能再無(wú)法按照“摩爾定律”增長(cháng);另一方面,數據增長(cháng)對計算性能要求超過(guò)了按“摩爾定律”增長(cháng)的速度,所以只能由異構計算提升算力,以此滿(mǎn)足日益增長(cháng)的海量數據計算需求。其主要原因在于以數據計算為驅動(dòng)力的同構CPU難以適應以高清視頻和影像、復雜多相流模型、海量平行數據計算、實(shí)時(shí)數據處理,以及其他新興高復雜度算法的需要,而GPU 的突出優(yōu)勢顯而易見(jiàn)。

著(zhù)眼于圖3 所示的處理器內部架構,各類(lèi)CPU 遵循的都是馮諾依曼架構,按照存儲程序順序執行,更擅長(cháng)于邏輯控制,而在大規模并行計算能力上受到極大限制。GPU 則采用數量眾多的并行計算單元,非常適合處理大量數據計算,不僅可以在圖形、圖像處理領(lǐng)域大顯身手,還被用于科學(xué)計算、密碼破解、數值分析及海量數據處理、金融分析等需要大規模并行計算的領(lǐng)域。GPU 的優(yōu)化機理不再局限于延遲性能,而是基于吞吐能力,通過(guò)指令集從物理底層直接支持軟件可編程。


1623813126650562.png

圖3 GPU優(yōu)于CPU的算力提升內部架構

當今世界最先進(jìn)的超級計算機(HPC)多數已經(jīng)轉向基于GPU 的異構體系,如2019 年排名第一的HPC(Summit),95% 算力由GPU 提供。根據算法的不同,GPU 的計算速度可以比CPU 快10 倍到100 倍以上。將來(lái)的數據中心和大數據處理也越來(lái)越依賴(lài)基于GPU 的異構算力來(lái)支撐。

3   新時(shí)代召喚博大的芯

對于國產(chǎn)化GPU 在解決AI 算力方面業(yè)已取得的巨大進(jìn)展陳維良頗為振奮,他表示,這些進(jìn)展包括兩個(gè)方面,其一主要側重于支持訓練或推理類(lèi)的AI 加速;其二是沐曦正在開(kāi)發(fā)的GPU 芯片,專(zhuān)注于需要更通用的強大算力的科學(xué)計算,既支持AI 處理,還支持包括“計算物理”、“計算化學(xué)”等與計算緊密結合的學(xué)科,使計算成為常規手段,同時(shí)滿(mǎn)足與工業(yè)相關(guān)的算力需求,涵蓋各種設計和仿真等。當今AI 屬于大框架下深度學(xué)習的神經(jīng)網(wǎng)絡(luò ),相關(guān)算子可以預見(jiàn),即便層數增加,網(wǎng)絡(luò )架構變復雜,仍基于卷積運算方式。通用計算則種類(lèi)極其繁雜,所需的算子各有千秋,因此通用異構GPU 的概念將從圖形處理器(Graphics Processing Unit)超越而成為宏大處理器(Grand Processing Unit)。

GPU 所追求的就是超高性能,在運算指標上往往采用FLOPS 單位,即每秒浮點(diǎn)運算次數,其“單指令多數據(SIMD)”類(lèi)型指令集利用數據級并行方式,執行一個(gè)指令即可進(jìn)行多個(gè)同時(shí)發(fā)生的計算。其單位已經(jīng)從GFLOPS 的十億級別上升到TFLOPS 的萬(wàn)億級別,業(yè)界目前最高水平超過(guò)300 多個(gè)TFLOPS,而下一代將翻倍,這就成為國際和國產(chǎn)GPU 競相期待達到的目標。

超高性能必然使功耗成為一個(gè)焦點(diǎn)問(wèn)題,目前最高端GPU 可達到(300~500)W,在芯片及應用中對信號傳輸帶寬和物理架構設計都要通盤(pán)考慮。存儲器配合無(wú)疑是影響GPU 性能的最重要單元,內部可以有多級的上百兆SRAM,而外部需要配規模巨大的高速DRAM。曾經(jīng)作為圖形處理器的GPU 有專(zhuān)用高速顯存GDDR 支持,并已發(fā)展到GDDR6。針對更高端的通用GPU,一種名為HBM(High Bandwidth Memory)的技術(shù)將顯存由平面擴展轉為向上延伸,以實(shí)現所占面積相同前提下存儲容量及位寬的數倍提升。這種堆疊封裝方法采用設計和工藝緊密結合的手段,顯存顆粒與GPU核心通過(guò)硅片中介層(Silicon Interposer)進(jìn)行連接,從而獲得更低的工作電壓和功耗。HBM1.0/HBM2.0 屬于2.5D 技術(shù),現階段已可以大批量生產(chǎn),未來(lái)會(huì )實(shí)現3D垂直封裝。

在全球AI 產(chǎn)業(yè)高速變化的大環(huán)境下,廣泛的行業(yè)分布為其應用拓展提供了廣闊前景,快速迭代算法推動(dòng)AI 技術(shù)商用帶來(lái)了無(wú)限商機,算法實(shí)現的算力基礎就是通用GPU 的不斷升級換代。打造行業(yè)一流的GPU 公司,從而搶占AI 產(chǎn)業(yè)發(fā)展的制高點(diǎn),需要在設計理念和創(chuàng )新架構上持續超越。新一代通用GPU 芯片將具有更高度的并行處理能力、更低內存延遲,并實(shí)現計算單元和內存間的靈活而豐富的連接,而且在功效和能效管理水平上有更大的提高。

沐浴著(zhù)AI 新時(shí)代曙光,晨曦正在展開(kāi)算力提供者的視野,以敏銳眼光展望以AI 為代表的未來(lái)新潮流。國產(chǎn)新型通用GPU 基礎架構的建立必將是一個(gè)艱辛的過(guò)程,走產(chǎn)學(xué)研結合之路,跟進(jìn)產(chǎn)業(yè)成熟之旅,抓住未來(lái)通用計算的算力需求,才能實(shí)現高性能處理器的落地。GPU 對于通用平臺生態(tài)系統的建立至關(guān)重要,需要完善的IDE 支持,具備軟件兼容性,能夠銜接和復用針對眾多智能算法和機器學(xué)習軟件的存量應用。面向未來(lái)布局,強強聯(lián)合有利于達到合力的效果,成為我國應對嚴峻高端技術(shù)挑戰,緊跟全球AI 日新月異算力增長(cháng)需求,促進(jìn)芯片設計和制造工藝能力突破的新興力量。期待來(lái)年宏大通用處理器GPU 脫穎而出。

參考文獻:

[1] 鄭小龍.決勝AI云端:芯火燎原看燧原[J].電子產(chǎn)品世界,2020(10):11-12.

(本文來(lái)源于《電子產(chǎn)品世界》雜志社2021年6月期)



關(guān)鍵詞: 202106 GPU GPGPU

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>