企業(yè) | 中國最大的計算芯片亮相,突破封裝極限
在近年來(lái)興起的國產(chǎn)芯片發(fā)展浪潮中,成立于2018年的燧原科技必然是當中不得不提的一個(gè)。
作為一家專(zhuān)注人工智能領(lǐng)域云端算力平臺,開(kāi)發(fā)自主知識產(chǎn)權的高算力、高能效比、可編程的通用人工智能訓練和推理產(chǎn)品的企業(yè),燧原科技自2018年成立以來(lái),就獲得了多家領(lǐng)先資本的青睞。截止今年,公司已經(jīng)獲得了32億人民幣的投資。在這些資金的推動(dòng)下,公司在產(chǎn)品方面也獲得了高速發(fā)展。
如上圖所示,燧原在成立次年,就推出了公司的第一代訓練芯片“邃思1.0”和“云燧T10/T11”人工智能訓練加速卡。并在接下來(lái)的一年里獲得了客戶(hù)和行業(yè)的認可。到了近日,燧原科技又帶來(lái)了公司新一代的芯片“邃思2.0”和全新的“云燧T20/T21”。給相關(guān)應用的性能帶來(lái)了大幅度提升。從某種程度看,燧原的這些產(chǎn)品還刷新了中國芯片的記錄。
中國最大的計算芯片
“我們新發(fā)布的邃思2.0是中國最大的計算芯片,與競爭對手的最新旗艦相比,邃思2.0也毫不遜色”,燧原科技COO張亞林在發(fā)布會(huì )上強調。從他的介紹我們可以看到,燧原科技的新一代芯片采用了2.5D封裝,在其中整合了9顆芯片。這樣的設計也使得整個(gè)芯片的整體封裝尺寸做到了驚人的57.6mm×57.6mm,達成國內領(lǐng)先的成就。
據介紹,邃思2.0進(jìn)行了大規模的架構升級,采用了新一代全自研的GCU-CARA全域計算架構,針對人工智能計算的特性進(jìn)行深度優(yōu)化,夯實(shí)了支持通用異構計算的基礎;支持全面的計算精度,涵蓋從FP32、TF32、FP16、BF16到INT8,并成為中國首款支持單精度張量TF32數據精度的人工智能芯片。單精度FP32峰值算力達到40 TFLOPS,單精度張量TF32峰值算力達到160 TFLOPS,以上數據均為國內第一。
此外,通過(guò)對HBM2E存儲的采用,燧原科技讓“邃思2.0”擁有了海量的吞吐能力。
從張亞林的介紹我們得知,邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64 GB內存,帶寬達1.8 TB/s。值得一提的是,“邃思2.0”是中國第一顆支持世界最先進(jìn)存儲HBM2E和單芯片64 GB內存的產(chǎn)品。
在發(fā)布邃思2.0的同時(shí),燧原科技還帶了公司的全新產(chǎn)品路線(xiàn)圖。張亞林在會(huì )上更是公布了燧原產(chǎn)品定理。他表示,燧原的每一代產(chǎn)品必須比前一代在“平均業(yè)務(wù)”中將每瓦性能提升三倍以上。在成本方面,也會(huì )更有優(yōu)勢。軟件更是必然會(huì )后向兼容可靠。
基于這樣的思路,燧原發(fā)布了公司訓練計算產(chǎn)品和推理計算產(chǎn)品的路線(xiàn)圖。張亞林表示,公司的下一代訓練芯片將在2023年面世,每瓦性能會(huì )比邃思2.0提升兩倍。屆時(shí)還會(huì )有推理芯片同步亮相,其性能也將獲得大幅提升。
不輸友商旗艦的加速卡
得益于邃思2.0的優(yōu)越性能,燧原科技打造出了不輸友商旗艦的加速卡云燧T20/T21.
如上圖所示,燧原科技第二代通用人工智能訓練加速卡“云燧T20”是一個(gè)全高全長(cháng)的PCIE板卡,在FP 32/TF 32下的峰值算力可以做到134.4T(單精度張量)和33.6T(單精度)。在BF16/FP16下的峰值算力則能做到134.4T。INT8的峰值算力更是達到了268.8T。這樣的數據讓其在與友商的旗艦相比,也能夠做到不相上下。這對于一個(gè)成立僅幾年的公司而言,是一個(gè)難得的成就。
至于采用OAM模組模式設計的云燧T21,如上圖所示,也在多個(gè)模式下?lián)碛薪艹龅谋憩F。
除了在計算能力上有了大幅度的提升,燧原科技同時(shí)還在互聯(lián)與軟件上同步投入,這讓公司能夠在降低開(kāi)發(fā)者開(kāi)發(fā)門(mén)檻的同時(shí),還能提升板卡在系統中的性能。
據介紹,燧原在新產(chǎn)品中引入GCU-LARE全域互聯(lián)技術(shù),作為一項公司專(zhuān)為人工智能訓練集群研發(fā)的互聯(lián)技術(shù),GCU-LARE能提供雙向300 GB/s互聯(lián)帶寬,支持數千張云燧CloudBlazer加速卡互聯(lián),實(shí)現優(yōu)異的線(xiàn)性加速比。
與此同時(shí),燧原自主知識產(chǎn)權的計算及編程平臺馭算TopsRider也獲得了升級。
燧原方面表示,通過(guò)軟硬件協(xié)同架構設計,全新的馭算TopsRider能夠充分發(fā)揮邃思2.0的性能;基于算子泛化技術(shù)及圖優(yōu)化策略,能支持主流深度學(xué)習框架下的各類(lèi)模型訓練;再通過(guò)利用Horovod分布式訓練框架與GCU-LARE互聯(lián)技術(shù)相互配合,為超大規模集群的高效運行提供解決方案。開(kāi)放升級的編程模型和可擴展的算子接口,為客戶(hù)模型的優(yōu)化提供了自定義的開(kāi)發(fā)能力。
在發(fā)布兩款加速卡的同時(shí),燧原還介紹了一個(gè)基于公司訓練卡打造的超大規模智算集群。張亞林告訴記者,這個(gè)名為云燧智能集群(CloudBlazer Matrix 2.0)的產(chǎn)品包含了8192張云燧訓練卡,可實(shí)現最高1.3E的算力。放眼全球,這在之前是沒(méi)有人能做到的?!斑@代表著(zhù)燧原正使用集群化產(chǎn)品登上中國智能計算和新基建算力舞臺”,張亞林強調。
共推生態(tài)
在產(chǎn)品發(fā)布會(huì )的同期,燧原科技CEO趙立東還帶來(lái)了公司在生態(tài)方面的計劃。
他首先指出,在工業(yè)4.0“智造”時(shí)代,人工智能是關(guān)鍵動(dòng)力。但因為摩爾定律放緩,產(chǎn)業(yè)必須會(huì )加快在異構計算的投入。那就意味著(zhù)以芯片為核心的算力是工業(yè)4.0兵家必爭之地?;谶@個(gè)考慮,燧原科技推出了異構計算生態(tài)——“燎原”計劃。
趙立東表示?!傲窃庇媱澋哪繕擞腥齻€(gè),分別是以人工智能為起點(diǎn),構建通用異構計算生態(tài);構建標準化的技術(shù)體系以及共建完整生態(tài)服務(wù)數字中國。而“燎原”計劃的內涵也包括繁榮開(kāi)放的開(kāi)發(fā)者生態(tài)、健康互利的產(chǎn)業(yè)生態(tài)和持續創(chuàng )新的教科研生態(tài)。
趙海東進(jìn)一步指出,經(jīng)過(guò)幾年的發(fā)展,燧原科技已經(jīng)發(fā)展起了一個(gè)研發(fā)人員接近90%的超過(guò)五百人團隊。這個(gè)擁有深厚水平的團隊也圍繞芯片的方方面面,為公司積累下了52項專(zhuān)利(包括45項發(fā)明專(zhuān)利),公司同時(shí)還有近30項專(zhuān)利正在申請。
從當前的行業(yè)現狀看來(lái),無(wú)論是在云端AI芯片,還是云端推理芯片,都擁有巨大的成長(cháng)基于。尤其是對于中國的相關(guān)從業(yè)者而言,更是機會(huì )多多。而對于跑得比較快的燧原來(lái)說(shuō),他們正處于一個(gè)前所未有的好位置,未來(lái)也值得期待。
來(lái)源:半導體行業(yè)觀(guān)察
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。
電容式接近開(kāi)關(guān)相關(guān)文章:電容式接近開(kāi)關(guān)原理