<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > 算力芯片,終局之戰?

算力芯片,終局之戰?

作者:焉知汽車(chē) 時(shí)間:2024-01-02 來(lái)源:搜狐科技 收藏

今天這篇文章的時(shí)候,我內心是焦慮的,甚至有點(diǎn)悲觀(guān)。

本文引用地址:http://dyxdggzs.com/article/202401/454374.htm

中國的芯片界同仁,不可謂不努力:充滿(mǎn)艱難險阻的工作,數十年如一日的煎熬,直面國際巨頭的競爭。在芯片具體產(chǎn)品層面,別人有性能優(yōu)勢,我們有價(jià)格優(yōu)勢。不敢說(shuō)能打個(gè)你來(lái)我往,但至少還有還手之力。

然而,在計算生態(tài)方面,我們則完全沒(méi)有招架之力。計算生態(tài)就像一只無(wú)形的手,抹去了我們僅有的一點(diǎn)可能的機會(huì ),阻擋著(zhù)我們前進(jìn)的步伐,讓我們距離世界先進(jìn)越來(lái)越遠。

更令人焦慮的是未來(lái):一方面,計算生態(tài)的作用在不斷地加強;另一方面,不同領(lǐng)域不同處理器的計算生態(tài)有進(jìn)一步融合的趨勢,逐漸形成新的超級生態(tài)。兩相疊加,一旦超級生態(tài)逐步建立,后進(jìn)者再無(wú)翻身的可能。

未來(lái)5-10年,大,將迎來(lái)終局之戰。

1 計算架構的發(fā)展趨勢

1.1 計算架構的發(fā)展階段

隨著(zhù)算力需求越來(lái)越高,同構CPU的業(yè)務(wù)場(chǎng)景越來(lái)越少,基于GPU或AI等DSA處理器的異構計算已經(jīng)成為主流。從發(fā)展的角度看,隨著(zhù)大模型等算力場(chǎng)景的持續挑戰,未來(lái)會(huì )進(jìn)一步從異構計算走向異構融合計算。

如果按照處理器類(lèi)型的數量進(jìn)行分類(lèi),可以分為三個(gè)階段:

  • 第一階段,單個(gè)處理器,即CPU同構計算階段。

  • 第二階段,兩個(gè)處理器,即CPU+GPU或CPU+其他專(zhuān)用加速處理器的異構計算階段。

  • 第三階段,三個(gè)或三個(gè)以上處理器,即多異構或異構融合計算階段。

行業(yè)在創(chuàng )新處理器的設計和實(shí)現方面進(jìn)行了很多探索,比如存算一體、重構計算、類(lèi)腦計算、量子計算等等。這些新型的計算架構設計或實(shí)現方法,從系統指令復雜度的視角,可以歸屬到DSA或ASIC的范疇。因此,這些創(chuàng )新,沒(méi)有跳脫異構融合計算的大框架。

以我目前淺薄的認識,個(gè)人覺(jué)得:異構融合計算,將是計算架構的終極形態(tài)。

1.2 CPU同構,單個(gè)處理器,單個(gè)生態(tài)

雖然僅僅只有一個(gè)處理器,但其計算生態(tài)已經(jīng)是地獄級難度。

Intel x86架構的優(yōu)勢,是在眾多處理器架構的廝殺中逐步確立的。隨著(zhù)x86的優(yōu)勢地位確立,基于x86架構的軟件生態(tài)逐漸成熟,即便是Intel自己,也無(wú)法改變這一局面。

Intel的64位安騰(Itanium)處理器,是一個(gè)非常典型的失敗的案例。安騰是Intel于2001年推出的64位架構的CPU處理器,Intel對之寄予厚望。雖然是Intel的親兒子,雖然是功能強大的64位CPU架構,雖然安騰的架構和微架構設計非常優(yōu)秀,但因為和x86的不兼容,完全一個(gè)新的生態(tài),不可避免的走向了失?。?021年7月29日是安騰處理器最后的出貨日期,英特爾正式告別了這款使用IA-64指令集的純64位處理器)。

與此形成鮮明對比的,是AMD64的成功。2003年,AMD推出了業(yè)界首款 64 位處理器 Athlon 64,帶來(lái)了AMD64(x86-64)指令集,即x86指令集的64位擴展超集,具備向下兼容的特點(diǎn)。因為向下兼容,繼承性地往前發(fā)展,最終成就了AMD64的成功。

1.3 GPU異構,兩個(gè)處理器,兩個(gè)生態(tài)融合

相對于Intel的x86 CPU計算生態(tài)是百家爭鳴的勝者,NVIDIA GPU的CUDA生態(tài),則是數年孤獨后的一鳴驚人。

在NVIDIA GPGPU之前,GPU真的就只是GPU,即專(zhuān)用于圖形計算的加速卡。這一時(shí)期的GPU,符合DSA的定義規范,可以當作是專(zhuān)用于圖像領(lǐng)域的G-DSA。直到NVIDIA GPGPU的出現。

2006年,NVIDIA發(fā)布GPGPU。NVIDIA發(fā)現,圖像處理有很多并行處理的部件,于是決定將這些專(zhuān)用的處理完全改造成通用的高效能小CPU核,于是GPGPU誕生了。雖然此時(shí),GPGPU已經(jīng)足夠通用,但其編程難度很高,于是NVIDIA又貼心地開(kāi)發(fā)了CUDA計算框架。即便如此,早期的CUDA功能并不強大,開(kāi)發(fā)仍然不夠友好。很多開(kāi)發(fā)者并不看好,認為CPU多核才是正確的發(fā)展道路。

直到2012年,Alexnet的問(wèn)世,深度學(xué)習時(shí)代的來(lái)臨,NVIDIA GPU+CUDA才成了熱門(mén)的計算平臺,助推著(zhù)NVIDIA市值超越一眾競爭對手,成為全球市值第一的芯片公司。再緊接著(zhù),2018年,AI大模型逐漸流行。進(jìn)一步把這股浪潮推向高潮,NVIDIA GPU一時(shí)間“洛陽(yáng)紙貴”,同時(shí),NVIDIA的市值突破了萬(wàn)億美金大關(guān)。

我們再來(lái)看CPU和GPU的融合。

2022年初,NVIDIA正式宣布,收購ARM失敗。假如,NVIDIA收購ARM成功,這場(chǎng)大的“戰爭”,基本上可以提前給出結果:NVIDIA獲勝,其他家永無(wú)出頭之日。好在這件事情沒(méi)有成行,“戰爭”的結果,仍存在變數,這場(chǎng)“戰爭”仍在繼續。

之后,NVIDIA退而求其次,與ARM的深度合作,開(kāi)發(fā)了Grace系列高性能CPU,以及CPU+GPU整合的Grace Hopper系列超級芯片。

2 計算生態(tài)的極端重要性

在之前,我一直以為T(mén)ransformer之所以能夠脫穎而出的最大原因就是那篇論文的標題:“Attention is all you need”,優(yōu)勢來(lái)源于算法本身。最近一段時(shí)間,跟好幾位AI領(lǐng)域的專(zhuān)家交流下來(lái),他們的觀(guān)點(diǎn)是:有很大一部分原因是因為,Transformer比較好的實(shí)現了并行處理,能夠最大限度的利用GPU并行的算力,因此才能夠實(shí)現更大參數規模的大模型,進(jìn)而獲得更好的智能體驗。

這個(gè)案例可以得到這樣一個(gè)結論:只有NVIDIA GPU+CUDA生態(tài)親和的模型才能最終走出來(lái);如果不是NVIDIA GPU+CUDA架構和生態(tài)友好的模型,哪怕實(shí)際效果再好,也受限于模型效率、參數規模和成本等方面的劣勢,無(wú)法脫穎而出。

或者說(shuō),大模型發(fā)展,強依賴(lài)于NVIDIA的GPU+CUDA計算生態(tài)。

在我的個(gè)人觀(guān)點(diǎn)里,一直以來(lái),都是非常重視生態(tài)的難度和重要性的。但最近幾年,隨著(zhù)認識的進(jìn)一步加深,我的想法得到了進(jìn)一步修正。計算生態(tài)很重要,但過(guò)去10年左右的發(fā)展,使得計算生態(tài)的重要性,比我們大家想象的要更加重要:

  • 一方面,業(yè)務(wù)快速發(fā)展迭代的壓力,使得大家更加依賴(lài)已有生態(tài)的持續優(yōu)化,而很難遷移到新的平臺和生態(tài)。

  • 另一方面,計算從單機計算走向集群跨集群的分布式計算,計算生態(tài)的作用得到進(jìn)一步放大。一是不同計算節點(diǎn)工作任務(wù)之間的協(xié)同,二是計算任務(wù)在集群內部不同計算節點(diǎn)之間可遷移,這些原因進(jìn)一步強化了計算生態(tài)的“強者更強,弱者更弱”。

  • 還有一方面,隨著(zhù)異構計算和異構融合計算的發(fā)展,處理器之間的協(xié)同效應逐漸產(chǎn)生并進(jìn)一步增大。不同處理器的單個(gè)計算生態(tài)開(kāi)始發(fā)生化學(xué)反應,逐步會(huì )形成融合的超級生態(tài)。

我們定性分析一下:

  • 芯片的難度很高,但生態(tài)的難度更高。

  • 假設,在十幾年之前,2010年前后,芯片的重要性和難度是1,計算生態(tài)的重要性和難度則為10。

  • 假設,隨著(zhù)系統規模的增大,未來(lái)5-10年,也就是2030年前后,單個(gè)處理器芯片的重要性和難度可能上升到10。受業(yè)務(wù)迭代越來(lái)越快的影響,計算生態(tài)的重要性和難度需要再增加一個(gè)數量級,其值約為1,000。

  • 在考慮集群/跨集群以及云網(wǎng)邊端融合成為主流計算方式的影響下,計算生態(tài)的重要性和難度再增加一個(gè)數量級,其值進(jìn)一步上升到10,000。

  • 再隨著(zhù)異構的處理器越來(lái)越多,不同處理器計算生態(tài)的協(xié)同效應凸顯,計算生態(tài)的重要性和計算難度再增加一個(gè)數量級,其值達到100,000。

  • 最終,芯片和計算生態(tài)的重要性和難度比例變成10:100,000,或者是1:10,000。

3 算力芯片,終局之戰 

3.1 多異構融合,更多生態(tài)的融合

我們來(lái)分析一下Intel在多(超)異構和未來(lái)異構融合計算的布局:

  • 首先是各類(lèi)處理器。CPU生態(tài),Intel首屈一指;GPU生態(tài),Intel也有自己的產(chǎn)品,也在積極的布局;DSA類(lèi)的生態(tài),Intel有IPU和IPDK進(jìn)一步整合和增強。

  • 然后是Intel在多異構融合、跨平臺,完全可編程和開(kāi)放生態(tài)方面都進(jìn)行了布局。Intel于2019年提出超異構計算概念,隨后Intel布局了OneAPI框架、OpenVINO計算套件、IPDK計算框架,還發(fā)起了OPI開(kāi)放計算聯(lián)盟等。目前,Intel的多異構或異構融合的芯片解決方案還沒(méi)有公開(kāi)發(fā)布,拭目以待。

Intel目前面臨的挑戰是:上面列出的很多內容,Intel提出之后,并沒(méi)有非常有競爭力的產(chǎn)品去承載。

(注:圖片為Altan結構框圖,Thor和Altan一致)

NVIDIA在汽車(chē)CCU方面,已經(jīng)布局了Thor超級芯片,其核心計算部分由數據中心架構的Grace CPU、Ampere GPU、Bluefield DPU組成。一方面算力強勁,把汽車(chē)變成了一臺超級計算機;另一方面,其架構跟數據中心處理器架構完全一致,為未來(lái)云邊端融合提供了堅實(shí)的物理基礎。

據說(shuō),NVIDIA在數據中心的CPU、GPU和DPU三芯片集成的、多種異構融合計算架構的超級芯片,已經(jīng)在研發(fā)中。

3.2 異構融合,最后一場(chǎng)戰役

在GPU領(lǐng)域,NVIDIA構建了牢不可破的CUDA計算生態(tài);在DPU領(lǐng)域,NVIDIA擁有全球最好的DPU芯片,以及功能強大的DOCA計算框架;高性能網(wǎng)絡(luò )可以看做DPU的一個(gè)重要的功能子集,NVIDIA擁有全球最好的高性能網(wǎng)絡(luò )RDMA和獨一無(wú)二的Infiniband技術(shù),高性能網(wǎng)絡(luò )是AI大模型訓練集群的核心技術(shù);在CPU領(lǐng)域,NVIDIA和ARM深度合作,搶占了比較有利的生態(tài)位。

一根筷子,輕輕地就會(huì )被折斷;十雙筷子,則牢牢地抱成一團,幾乎牢不可破:

  • 同構計算的時(shí)代,面臨的僅僅是一個(gè)計算生態(tài)的挑戰;生態(tài)劣勢的廠(chǎng)家,仍然有翻盤(pán)的可能。

  • 異構計算的時(shí)代,面臨的則有兩個(gè)計算生態(tài)的挑戰,還有兩個(gè)處理器協(xié)同生態(tài)的挑戰;這個(gè)時(shí)候,生態(tài)劣勢的廠(chǎng)家,面對計算生態(tài)的無(wú)形之手,已經(jīng)有點(diǎn)力不從心。

  • 異構融合計算時(shí)代,計算平臺預計會(huì )多達5-10個(gè)處理器,面臨的不僅僅是5-10個(gè)計算生態(tài)的挑戰,更要面臨這些處理器組成的融合計算超級計算生態(tài)的挑戰;這個(gè)時(shí)候,會(huì )進(jìn)一步放大計算生態(tài)的“強者恒強,弱者恒弱”效應,生態(tài)劣勢的廠(chǎng)家,不但無(wú)法翻盤(pán),甚至連微小的一點(diǎn)市場(chǎng)份額都很難維持。

在未來(lái)5-10年,隨著(zhù)生態(tài)的極端重要性進(jìn)一步凸顯,大算力芯片,即將迎來(lái)“終局之戰”。

4 唯一可能的破局之道:開(kāi)放

回到現實(shí),大算力芯片的計算生態(tài)之爭,“唯一可能”的破局之道:開(kāi)放?!拔ㄒ弧笔钦f(shuō),有且僅有這一個(gè)辦法;“可能”指的是,這個(gè)方法雖然存在贏(yíng)的幾率,但幾率很低很低。

4.1 異構融合計算,架構必須收斂

指令復雜度越高,單個(gè)處理器引擎覆蓋的場(chǎng)景就會(huì )越小,全場(chǎng)景覆蓋所需的引擎種類(lèi)就會(huì )越多。從CPU到ASIC,處理器引擎越來(lái)越碎片化,構建生態(tài)越來(lái)越困難。

異構融合計算時(shí)代,集成的處理引擎類(lèi)型和數量越來(lái)越多,處理引擎架構越來(lái)越多,芯片平臺的數量也越來(lái)越多,所處的位置(云網(wǎng)邊端)也越來(lái)越豐富。

解決辦法只有一個(gè):讓架構收斂。每一個(gè)類(lèi)型或子類(lèi)型的處理器,全球全行業(yè)能夠形成標準的架構和接口。

不確定的是,未來(lái)是走向封閉的一家通吃?還是行業(yè)形成共識,大家基于開(kāi)放架構做產(chǎn)品,行業(yè)走向基于產(chǎn)品競爭力的、真正的“公平”競爭?

4.2 除了最強者,開(kāi)放是其他家的唯一選擇

只要你不是第一,第二名能做的也只能是開(kāi)放。

開(kāi)放陣營(yíng),不僅僅會(huì )包括行業(yè)里的二線(xiàn)、三線(xiàn)芯片公司,以及廣大的Startup公司,還會(huì )包括目前仍處于一線(xiàn)大廠(chǎng)的眾多知名公司。

從目前看可見(jiàn)的未來(lái),NVIDIA會(huì )是最后贏(yíng)者通吃最有優(yōu)勢的那個(gè)。那么,這個(gè)陣營(yíng)包括Intel、AMD、高通、博通、Marvell等知名芯片公司,也包括互聯(lián)網(wǎng)巨頭等芯片的大客戶(hù),如蘋(píng)果、谷歌、微軟、華為、阿里、騰訊等,也包括OpenAI等AI/AGI新貴。對抗巨頭的唯一做法,唯有凝聚共識,開(kāi)源開(kāi)放。

4.3 開(kāi)放,讓大家回到同一起跑線(xiàn)

我們設想一個(gè)烏托邦的時(shí)代,在這個(gè)時(shí)代里:

  • CPU領(lǐng)域,已經(jīng)是形成共識的開(kāi)放架構成為主流,比如RISCv占據90%以上市場(chǎng)份額;

  • GPU領(lǐng)域,也出現了全行業(yè)形成共識的開(kāi)放架構和相應的開(kāi)源的開(kāi)發(fā)框架;

  • AI、網(wǎng)絡(luò )、存儲等領(lǐng)域也是如此,均形成了各自開(kāi)放的架構和行業(yè)生態(tài)。

  • 并且,進(jìn)一步的,行業(yè)形成了開(kāi)源開(kāi)放的統一的異構融合計算框架。

那么,這個(gè)時(shí)候,大家會(huì )回到同一個(gè)起跑線(xiàn):靠產(chǎn)品能力說(shuō)話(huà),而不是依靠無(wú)形的手——生態(tài)的力量。



關(guān)鍵詞: 算力芯片

評論


技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>