<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > 770億晶體管的中國第一算力通用GPU芯片!壁仞科技BR100亮相海外

770億晶體管的中國第一算力通用GPU芯片!壁仞科技BR100亮相海外

作者: 時(shí)間:2022-09-19 來(lái)源:快科技 收藏

8月9日,國內科技創(chuàng )新企業(yè)(Birentech)正式發(fā)布了BR100系列通用計算GPU,號稱(chēng)算力國內第一,多向指標媲美甚至超越國際旗艦產(chǎn)品。

本文引用地址:http://dyxdggzs.com/article/202209/438306.htm



當地時(shí)間8月22日,第34屆Hot Chips芯片大會(huì )首日演講,NVIDIA Hopper、AMD Instinct MI200、Intel Ponte Vecchio三大巨頭的通用GPU紛紛秀出肌肉,而與之并肩亮相的,就是BR100。



會(huì )上,聯(lián)合創(chuàng )始人、CTO洪洲與壁仞科技聯(lián)合創(chuàng )始人、總裁徐凌杰進(jìn)行了題為“Biren BR100 : Accelerating Datacenter Scale AI Computing”的主題演講,為來(lái)自全球的專(zhuān)業(yè)聽(tīng)眾介紹了BR100芯片的特點(diǎn)與原創(chuàng )芯片架構的細節。



根據介紹,作為主要用于加速數據中心規模通用計算的芯片,BR100具有極高的算力密度,單卡16位浮點(diǎn)算力達到PFLOPS級別,并具備高速片上與片外互連帶寬。



BR100采用7nm制程工藝、Chiplet小芯片設計和CoWoS 2.5D封裝技術(shù),以OAM模組形態(tài)部署,能夠在通用UBB主板上形成8卡點(diǎn)對點(diǎn)全互連拓撲。



為了支持強大的算力,BR100配備了超過(guò)300MB的片上高速緩存,用于數據的暫存和重用,以及64GB的HBM2E高速內存。



它的核心計算單元由大量通用流式處理器組成,具備通用計算和2.5D GEMM架構的專(zhuān)用張量加速算力。



在原創(chuàng )架構層面,壁仞科技按照深度學(xué)習等通用負載的計算特點(diǎn),提供一系列針對數據流的增強特性,包括特殊的C-Warp協(xié)同并發(fā)模式、張量數據存取加速器TDA、NUMA/UMA訪(fǎng)存模式、近存儲計算等。這些特性是BR100能夠在算力和能效比上達到全球領(lǐng)先水準的關(guān)鍵。



此外,壁仞科技還介紹了一種新的TF32+數據類(lèi)型,具備比TF32數據類(lèi)型更高的精度。



在軟件方面,壁仞科技還介紹了BIRENSUPATM軟件棧,其核心編程模型具有C/C++編程接口和運行時(shí)API,風(fēng)格與主流的開(kāi)發(fā)語(yǔ)言和編程范式類(lèi)似。



它能夠使開(kāi)發(fā)者在BR100上非常容易地進(jìn)行編程開(kāi)發(fā),同時(shí)大幅降低代碼遷移工作量,實(shí)現從主流編程環(huán)境向BIRENSUPA平臺的無(wú)縫遷移。



資料顯示,壁仞科技BR100集成了多達770億晶體管,規模上堪比人類(lèi)大腦神經(jīng)細胞,已經(jīng)非常接近800億個(gè)晶體管的NVIDIA GH100計算核心,而且BR100系列芯片一次就點(diǎn)亮成功了!



性能方面,INT8整數計算2048 Tops(每秒2048萬(wàn)億次)、BF16浮點(diǎn)計算1024 TFlops(每秒1024萬(wàn)億次)、TF32+浮點(diǎn)計算512 TFlops(每秒512萬(wàn)億次)、FP32雙精度浮點(diǎn)256 TFlops(每秒256萬(wàn)億次)。



此外,它的外部IO帶寬達2.3TB/s,支持64路編碼、512路解碼,還支持PCIe 5.0、CXL互連協(xié)議。





關(guān)鍵詞: GPGPU 國產(chǎn) 壁仞科技

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>