<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 把GPT時(shí)代引擎拉滿(mǎn)，國產(chǎn)AI大算力芯片換道狂飆

把GPT時(shí)代引擎拉滿(mǎn)，國產(chǎn)AI大算力芯片換道狂飆

發(fā)布人：芯東西時(shí)間：2023-04-12 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

發(fā)布文章

生成式AI掀起驚濤駭浪，算力、能耗、成本狂飆，中國AI大算力芯片們是繼續嘗試同道追趕、爭取彎道超車(chē)，還是緊盯客戶(hù)需求、不拘一格、開(kāi)啟創(chuàng )新的換道發(fā)展之路？

作者 | ZeR0
編輯 | 漠影
從2022年11月開(kāi)始，美國人工智能（AI）公司OpenAI連續祭出ChatGPT家族的3、3.5、4以及插件還有商業(yè)落地模式的連環(huán)大招，引爆了全球關(guān)注和期待AI應用發(fā)展的新一輪熱潮。而在此之前，AI發(fā)展歷程中已出現過(guò)兩次“圣杯時(shí)刻”。2012年10月，在國際頂級賽事ImageNet計算機視覺(jué)挑戰賽上，杰弗里·辛頓與其團隊用卷積神經(jīng)網(wǎng)絡(luò )（CNN）算法一舉奪魁，憑借比人眼識別還低的錯誤率，掀開(kāi)了計算機視覺(jué)盛世的序章。2016年3月，DeepMind研發(fā)的AI程序AlphaGo戰勝世界圍棋冠軍李世石，在全世界擲下一枚重磅炸彈?！叭斯ぶ悄堋睆拇顺鋈?，創(chuàng )業(yè)狂瀾席卷全球，2016年也被稱(chēng)作“人工智能元年”。兩次“圣杯時(shí)刻”背后的算力功臣，分別是英偉達GPGPU（通用圖形處理單元）芯片與谷歌TPU（張量處理單元）芯片。他們也成為業(yè)界AI大算力芯片企業(yè)競相模仿和追趕的對象。如今，ChatGPT的橫空出世宣告著(zhù)AI行業(yè)迎來(lái)第三次“圣杯時(shí)刻”，業(yè)界也將其盛贊為AI時(shí)代的“iPhone時(shí)刻”。盡管ChatGPT及一眾主流大模型背后的芯片主力仍是GPGPU，但嚴峻的挑戰已經(jīng)擺到眼前：一邊是計算量爆棚的生成式AI與大模型發(fā)展熱情高漲，另一邊是即將觸頂的算力增長(cháng)空間與算力消耗所帶來(lái)的驚人碳排放量。正如馬斯克所述，大多數人會(huì )用舉一反三的類(lèi)比推理來(lái)思考問(wèn)題，即模仿別人做的事情再加以小幅更改，可如果想做出新的東西，必須敢于打破常規、積極質(zhì)疑舊的經(jīng)驗知識，探究問(wèn)題本質(zhì)，層層推演，進(jìn)而創(chuàng )造出新的解決方案。中國AI大算力芯片的創(chuàng )新之路，大抵亦是如此。當ASIC、GPGPU發(fā)展道路面臨底層技術(shù)與產(chǎn)業(yè)需求的雙向夾擊，“換道”也許能開(kāi)辟新的可能。誰(shuí)能率先填補大模型算力需求的缺口，誰(shuí)就有機會(huì )搶占新一輪AI芯片搶位賽的前排。
01.國產(chǎn)AI大算力芯片的
三波創(chuàng )業(yè)浪潮與三大技術(shù)流派

ChatGPT引起的算力焦慮，已經(jīng)將提高能效比與算力利用率的迫切性推到臺前。在產(chǎn)業(yè)前景、戰略重要性、自主可控等多重因素驅動(dòng)下，一批批中國AI芯片企業(yè)立足于不同的技術(shù)路徑，前赴后繼地進(jìn)入AI大算力芯片領(lǐng)域，并形成群雄逐鹿的三大技術(shù)流派。第一波浪潮是基于ASIC架構，也可以劃定為中國AI大算力芯片落地的技術(shù)1.0。這可追溯至2015年-2016年，并稱(chēng)“天寒地鑒”的AI芯片四小龍云天勵飛、寒武紀、地平線(xiàn)、深鑒科技，都是在此期間啟動(dòng)AI芯片研發(fā)。其中唯一的FPGA代表玩家深鑒科技于2018年被美國FPGA龍頭賽靈思收購。寒武紀和地平線(xiàn)分別是領(lǐng)跑云端和自動(dòng)駕駛國產(chǎn)大算力芯片落地的企業(yè)，都選擇做ASIC（專(zhuān)用芯片）。2016年5月，谷歌揭曉AlphaGo背后的功臣TPU，吹響了產(chǎn)業(yè)沿襲ASIC路線(xiàn)的號角。此后多家創(chuàng )企以及華為、亞馬遜等云計算大廠(chǎng)均選擇在A(yíng)SIC芯片賽道安營(yíng)扎寨。上海交通大學(xué)計算機科學(xué)與工程系教授梁曉峣告訴智東西，在算法較固定的情況下，專(zhuān)用芯片的性能和功耗優(yōu)勢明顯，能夠滿(mǎn)足企業(yè)對極致算力和能效的追求。

▲AI不同計算任務(wù)需要各類(lèi)芯片實(shí)現（圖源：浙商證券）

然而，下游AI算法的演進(jìn)速度遠超想象。根據頂級AI研究企業(yè)OpenAI在2018年發(fā)布的一份分析報告，自2012年到2017年，訓練最大AI模型所使用的算力每3.4個(gè)月翻1倍。相比之下，按照芯片行業(yè)的“圭臬”摩爾定律，芯片上容納的晶體管數量每18~24個(gè)月才會(huì )翻1倍，兩者之間僅從翻倍的時(shí)間上，就產(chǎn)生了16-20個(gè)月的差距。專(zhuān)用芯片在特定場(chǎng)景能實(shí)現更高算力和能效，但難以適應算法種類(lèi)快速的增加以及迭代速度，因此通用性更強的GPGPU一直是AI芯片的主角。在2018年中美科技競爭大幕拉開(kāi)后，國產(chǎn)替代的呼聲越來(lái)越高，創(chuàng )業(yè)熱點(diǎn)隨之切換到英偉達雄踞多年的GPGPU（通用GPU）賽道。這成為第二波浪潮中主流技術(shù)路徑，也可以劃定為中國AI大算力芯片落地的技術(shù)2.0。天數智芯、登臨科技、壁仞科技、摩爾線(xiàn)程、沐曦集成電路等一批初創(chuàng )公司，大致都是2017年-2020年期間創(chuàng )業(yè)或啟動(dòng)自研GPGPU芯片的研發(fā)。資本也蜂擁而至，邏輯很簡(jiǎn)單，GPGPU市場(chǎng)有英偉達珠玉在前，已經(jīng)驗證了成功的可能性。以英偉達上百億美元年收入與躋身全球前十的市值來(lái)看，假若能切走英偉達在中國的市場(chǎng)份額，足以帶給國產(chǎn)AI大算力芯片企業(yè)優(yōu)渥的回報。但無(wú)論是ASIC還是GPGPU，在應對生成式AI及大模型正對算力基礎設施提出的新要求，都顯得多少有些捉襟見(jiàn)肘。

▲大模型參數邁向千億時(shí)代，算力需求一路飆漲（圖源：浙商證券）

眼見(jiàn)著(zhù)摩爾定律身陷邊際效用遞減的困境，ASIC芯片的弱通用性難以應對下游算法的快速演化，GPGPU又難解高功耗與低算力利用率問(wèn)題，業(yè)界正翹首以盼新架構、新工藝、新材料、新封裝，以進(jìn)一步突破算力天花板。與此同時(shí)，博弈氣息日漸濃厚的地緣關(guān)系，又給對先進(jìn)制程工藝高度依賴(lài)的AI大算力芯片創(chuàng )企們提出了技術(shù)之外的新難題。在這些大背景下，第三波創(chuàng )業(yè)浪潮正滾滾向前。從2017年到2021年期間集中成立的一批創(chuàng )企，選擇探路存算一體等新興技術(shù)，這可以被劃定為中國AI大算力芯片落地的技術(shù)3.0。不同于A(yíng)SIC與GPGPU，這些新興技術(shù)路線(xiàn)跳出了馮·諾依曼架構體系，理論上擁有得天獨厚的高能效比優(yōu)勢，又能繞過(guò)先進(jìn)制程封鎖，兼顧更強通用性與更高性?xún)r(jià)比，算力發(fā)展空間巨大。隨著(zhù)新型存儲器件走向量產(chǎn)，存算一體AI芯片已經(jīng)挺進(jìn)AI大算力芯片落地競賽。

▲馮·諾依曼、近存計算、存內計算架構對比（圖源：億鑄科技）

而無(wú)論是傳統計算芯片還是存算一體芯片，在實(shí)際加速AI計算時(shí)往往還需處理大量的邏輯計算、視頻編解碼等非AI加速計算領(lǐng)域的計算任務(wù)。隨著(zhù)多模態(tài)成為大模型時(shí)代的大勢所趨，AI芯片未來(lái)需處理文本、語(yǔ)音、圖像、視頻等多類(lèi)數據。這個(gè)問(wèn)題如何解決？億鑄科技，一家做存算一體AI大算力芯片的創(chuàng )企提出了自己的解法——存算一體超異構AI大算力技術(shù)路徑。這也是業(yè)內首次提出將存算一體和超異構做結合，提供在大模型時(shí)代AI大算力芯片換道發(fā)展的一個(gè)全新思路。
02.兼顧通用性&高性能未來(lái)必然走向超異構

生成式AI和大模型時(shí)代向算力基礎設施提出的核心要求，可以簡(jiǎn)單概括為幾個(gè)詞：提高單芯片算力，突破算力利用率，實(shí)現更高能效比。上海交通大學(xué)計算機科學(xué)與工程系教授、博導梁曉峣及其團隊是開(kāi)源GPGPU平臺“青花瓷”的發(fā)起者。他談道，當下需從系統的角度來(lái)思考問(wèn)題。首先在單芯片算力方面，他非?？春么嫠阋惑w，認為通過(guò)引入新型存儲器件工藝，存算一體AI芯片有望將單芯片算力提高1~2個(gè)數量級。

▲存算一體能實(shí)現超越傳統ASIC芯片的更大算力、更高能效（圖源：浙商證券）

但單顆芯片很難為大模型提供充足的計算資源與存儲資源，這就需要將很多計算芯片連在一起，形成系統。據韓媒報道，受ChatGPT熱潮驅動(dòng)，韓國兩大存儲芯片巨頭三星電子、SK海力士的高帶寬內存（HBM）接單量大增。芯片與芯片之間的數據傳輸過(guò)程，往往會(huì )造成大量不必要的資源浪費，導致計算系統受限于傳輸帶寬瓶頸，在實(shí)際應用中發(fā)揮的算力遠小于理論峰值算力。要進(jìn)一步提升計算資源利用率，必須研究更先進(jìn)的互連技術(shù)，以實(shí)現成千上萬(wàn)個(gè)AI芯片之間的高效協(xié)同。最后，軟件的迭代升級亦不可或缺。要降低芯片開(kāi)發(fā)門(mén)檻并實(shí)現所有芯片的高效協(xié)同，需要設計分布式的AI編程軟件平臺，來(lái)解決線(xiàn)程調度、同步、任務(wù)平衡等復雜問(wèn)題。“沒(méi)有一個(gè)單芯片能夠獨立解決大模型問(wèn)題，所以一定是走向一個(gè)超異構。”梁曉峣說(shuō)，盡管他很看好存算一體路線(xiàn)，但僅靠存算一體還不夠，還需與其他架構配合，形成一個(gè)完整的系統。億鑄科技首次提出的“存算一體超異構”概念，就有可能是一個(gè)未來(lái)的理想組合。超異構計算將CPU、GPGPU、CIM（存內計算）等不同類(lèi)型的芯片用先進(jìn)封裝技術(shù)組合，讓不同架構各司其職，既有靈活、可編程的部分來(lái)適應算法的快速變化，又有定制化部分來(lái)提供超高性能和超低功耗，通過(guò)統籌調度，綜合發(fā)揮出多類(lèi)芯片架構的優(yōu)勢，將整體效率做到最優(yōu)。由于器件優(yōu)勢，存算一體在同等功耗下能承擔更大算力。在超異構計算的基礎上，以存算一體架構為核心，以其他架構作輔助，理論上能夠兼顧對高算力與通用性的需求。億鑄科技創(chuàng )始人、董事長(cháng)兼CEO熊大鵬博士相信，存算一體超異構將來(lái)會(huì )成為AI算力芯片的主流技術(shù)路線(xiàn)之一。在今年2月份舉行的國際芯片設計領(lǐng)域最高級別會(huì )議ISSCC 2023大會(huì )上，AMD董事長(cháng)兼CEO蘇姿豐也提出了相似的“系統級創(chuàng )新”概念，即綜合考慮跨計算、跨通信、跨內存等各項元素，從整體上推動(dòng)系統級性能和能效的提升。而存算一體超異構理念的前瞻性和落地可行性在于，它不像基于傳統計算架構的大算力芯片那樣依賴(lài)先進(jìn)制造技術(shù)。這一思路需結合的新架構、新存儲、新封裝等前沿技術(shù)，國內均已有儲備。
03.減輕先進(jìn)制程依賴(lài)癥，億鑄科技的存算一體超異構如何換道超車(chē)？

據悉，存算一體超異構主要運用到新型憶阻器（RRAM）、存算一體架構、Chiplet（芯粒）、3D封裝等技術(shù)，而國內企業(yè)在這些技術(shù)路線(xiàn)上已經(jīng)有越來(lái)越多的起色。Chiplet及先進(jìn)封裝方案能夠彌補先進(jìn)制程落后的劣勢，通過(guò)將來(lái)自不同生產(chǎn)廠(chǎng)商、不同制程工藝的芯片組件“混搭”，降低實(shí)現目標性能所需的成本。這為國內芯片企業(yè)提供彎道超車(chē)的機會(huì )。目前，國內封測巨頭相關(guān)技術(shù)積累已初顯成效。例如長(cháng)電科技的XDFOI Chiplet高密度多維異構集成系列工藝已進(jìn)入穩定量產(chǎn)階段；通富微電與AMD密切合作，已大規模生產(chǎn)7nm Chiplet產(chǎn)品；華天科技的Chiplet系列工藝也實(shí)現量產(chǎn)。

▲未來(lái)算力升級路徑：Chiplet、存算一體（圖源：浙商證券）

從單芯片來(lái)看，熊大鵬告訴智東西，存算一體芯片屬于是“換道超車(chē)”，對工藝的要求較低，比如在28nm工藝上實(shí)現的算力和能效，就能比肩甚至超過(guò)傳統架構芯片在7nm工藝上的表現。梁曉峣說(shuō)，億鑄科技是第一家嘗試設計并量產(chǎn)基于ReRAM全數字存算一體AI大算力芯片的企業(yè)。據熊大鵬透露，億鑄科技自研的存算一體AI大算力芯片，或將在75W-100W功耗范圍內實(shí)現接近1P的算力，能效比優(yōu)勢非常顯著(zhù)，將于今年回片。同時(shí)，億鑄科技基于存算一體超異構概念的下一代芯片設計工作已經(jīng)開(kāi)始推進(jìn)。從器件來(lái)看，相比傳統存儲器存在易失性、微縮性差等痼疾，億鑄科技選擇采用的非易失性新型存儲器RRAM更適合應用于A(yíng)I大算力場(chǎng)景。此前，臺積電、聯(lián)電、中芯國際、昕原半導體等代工廠(chǎng)均建立了商業(yè)化RRAM產(chǎn)線(xiàn)。去年2月，昕原半導體主導建設的RRAM 12寸中試生產(chǎn)線(xiàn)已順利完成自主研發(fā)裝備的裝機驗收工作，實(shí)現中試線(xiàn)工藝流程的通線(xiàn)，并成功流片。熊大鵬認為，隨著(zhù)工藝不斷迭代，國內“超車(chē)”速度會(huì )越來(lái)越快，優(yōu)勢會(huì )越來(lái)越明顯。從超異構來(lái)看，對于國內企業(yè)來(lái)說(shuō)，CPU有廣受歡迎的開(kāi)源RISC-V架構，GPGPU有新興的開(kāi)源架構“青花瓷”平臺，存算一體也有億鑄科技等廠(chǎng)商在大力投入研發(fā)。開(kāi)源GPGPU“青花瓷”平臺由上海交通大學(xué)先進(jìn)計算機體系結構實(shí)驗室開(kāi)發(fā)，定位相當于GPGPU領(lǐng)域的RISC-V架構。它提供了一個(gè)免費開(kāi)放的先進(jìn)GPGPU指令集和架構參考設計，能夠接入現有GPGPU生態(tài)，從而助力降低設計門(mén)檻，加速相應產(chǎn)品的落地。

▲“青花瓷”平臺開(kāi)源代碼頁(yè)面

“青花瓷”平臺直通門(mén)：gpgpuarch.org

開(kāi)源地址：github.com/SJTU-ACA-Lab/blue-porcelain在梁曉峣看來(lái)，超異構需要不同類(lèi)型的芯片架構互相配合、取長(cháng)補短，這恰好與“青花瓷”平臺的設計思路完美契合。存算一體架構適用于計算和數據量大但算法相對簡(jiǎn)單的應用，在性能和功耗的優(yōu)勢超過(guò)其他類(lèi)型架構；而GPGPU架構可以適配現有的主流AI框架和平臺，并能處理比較復雜的算法。兩者結合，將會(huì )實(shí)現更大有效算力、放置更多參數、實(shí)現更高能效比、更好的軟件兼容性。因此，面向未來(lái)大模型時(shí)代，存算一體超異構的技術(shù)路徑打開(kāi)了國內AI大算力芯片技術(shù)發(fā)展的新思路，而億鑄科技的存算一體超異構芯片是該路徑在國內切實(shí)落地的關(guān)鍵一步。
04.結語(yǔ)：大模型落地勢不可擋AI算力困境亟待換道突破

正如蘇姿豐所言，AI已是未來(lái)十年最重要的事。在生成式AI風(fēng)暴的催化下，大模型正發(fā)展成AI基礎研究和產(chǎn)業(yè)化落地的一大趨勢。這對三波創(chuàng )業(yè)浪潮中的一眾AI大算力芯片創(chuàng )業(yè)公司提出了摩爾定律瀕臨極限之外更大的技術(shù)挑戰：如何以更低的系統成本、更少的能源消耗，支撐起龐大且持續增加的參數量所帶動(dòng)的更高算力需求？在美國對華屢屢架設芯片藩籬的背景之下，國內短期內難以實(shí)現先進(jìn)制程的自主可控?；赝袊鳤I大算力芯片發(fā)展歷程，業(yè)界一直用“彎道超車(chē)”來(lái)寄予對其發(fā)展路徑的期待，但彎道超車(chē)隱喻著(zhù)產(chǎn)品和技術(shù)的發(fā)展和行業(yè)頭部企業(yè)在同一賽道上做跟隨和追及，這勢必對后來(lái)者在速度上和超車(chē)節點(diǎn)的把握上提出了更高的要求。骨感的現實(shí)告訴我們，中國AI大算力芯片在“彎道超車(chē)”路徑下，也許還有很長(cháng)的路要追趕。而“換道”可能加速縮短與國際先進(jìn)水平的差距。同時(shí)，換道發(fā)展也不是無(wú)本之木，其芯片設計和量產(chǎn)有著(zhù)嚴謹的底層邏輯和成熟的產(chǎn)業(yè)鏈配套作為支撐。億鑄科技的存算一體超異構AI大算力芯片技術(shù)，便提供了一種能夠適應未來(lái)算法快速變化、滿(mǎn)足算力可持續發(fā)展需求的可行思路。中國AI大算力芯片企業(yè)面臨的挑戰依然險峻，但不管是落地技術(shù)的1.0、2.0還是3.0，不管是同道追及還是換道前行，所有的努力都是為了支撐中國AI產(chǎn)業(yè)的高速發(fā)展，只要能切實(shí)解決問(wèn)題，提供有價(jià)值的產(chǎn)品，都值得關(guān)注和期待。沉舟側畔千帆過(guò)，病樹(shù)前頭萬(wàn)木春，希望看到更多像億鑄科技這樣的機構，大步流星地走到換道前行的賽道上，為破解國內AI大算力困局探尋屬于中國AI芯片產(chǎn)業(yè)自己的發(fā)展道路。

*博客內容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀(guān)點(diǎn)，如有侵權請聯(lián)系工作人員刪除。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 大算力

相關(guān)推薦

為AI算力發(fā)展賦能億鑄科技獲頒中國AI算力層創(chuàng )新企業(yè)

智能計算 AI芯片億鑄科技大算力 | 2023-04-27

億鑄科技攜手科華云集團，以高能效智算贏(yíng)大算力未來(lái)

智能計算億鑄科華云智算大算力 | 2023-05-05

億鑄科技榮膺中國AI芯片創(chuàng )新突破技術(shù)獎

智能計算 AI芯片億鑄科技大算力 | 2023-04-27

焦點(diǎn)

推薦視頻

更多>>

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>