<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 業(yè)界動(dòng)態(tài) > 史上最大AI芯片誕生：462平方厘米、40萬(wàn)核心、1.2萬(wàn)億晶體管，創(chuàng )下4項世界紀錄

史上最大AI芯片誕生：462平方厘米、40萬(wàn)核心、1.2萬(wàn)億晶體管，創(chuàng )下4項世界紀錄

作者：曉查時(shí)間：2019-08-22 來(lái)源：量子位

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

本文經(jīng)AI新媒體量子位（公眾號 ID: QbitAI）授權轉載，轉載請聯(lián)系出處。

本文引用地址：http://dyxdggzs.com/article/201908/403994.htm

史上最大AI芯片誕生：462平方厘米、40萬(wàn)核心，創(chuàng )下4項世界紀錄

美國一家芯片公司Cerebras推出了史上最大AI芯片，號稱(chēng)“晶圓級引擎”（Cerebras Wafer Scale Engine，簡(jiǎn)稱(chēng)WSE）。

WSE將邏輯運算、通訊和存儲器集成到單個(gè)硅片上，是一種專(zhuān)門(mén)用于深度學(xué)習的芯片。它創(chuàng )下了4項世界紀錄：

晶體管數量最多的運算芯片：總共包含1.2萬(wàn)億個(gè)晶體管。雖然三星曾造出2萬(wàn)億個(gè)晶體管的芯片，卻是用于存儲的eUFS。

芯片面積最大：尺寸約20厘米×23厘米，總面積46,225平方毫米。面積和一塊晶圓差不多。

片上緩存最大：包含18GB的片上SRAM存儲器。

運算核心最多：包含40萬(wàn)個(gè)處理核心。

WSE由臺積電代工，但是并沒(méi)有使用當前最先進(jìn)的7nm工藝，而是使用相對較老的16nm制程工藝制造。

臺積電運營(yíng)高級副總裁JK Wang表示：“我們對與Cerebras合作制造WSE非常滿(mǎn)意，這是晶圓級開(kāi)發(fā)的行業(yè)里程碑?！?/p>

雖然WSE制造成本可能很高，但Cerebras認為片上互連比構建和連接獨立的內核速度更快、成本更低。

與其他芯片對比

WSE可以說(shuō)是個(gè)龐然大物，一般的芯片都可以放在手掌心，而WSE面積比Mac的鍵盤(pán)還要大。官方在介紹這款芯片時(shí)，需要用雙手捧著(zhù)，和展示晶圓沒(méi)什么兩樣。

史上最大AI芯片誕生：462平方厘米、40萬(wàn)核心，創(chuàng )下4項世界紀錄

WSE面積比英偉達最大的GPU核心V100還要大56倍，V100核心的尺寸為815平方毫米，包含211億個(gè)晶體管。

最近AMD為數據中心提供的Epyc 2芯片，也是世界上最快的x86處理器，也只有320億個(gè)晶體管，數量?jì)H為WSE的30分之一。

英特爾最新的桌面級處理器i9-9900k有16MB緩存，英偉達RTX 2080Ti有5.5MB二級緩存，在WSE 18GB緩存面前也是小巫見(jiàn)大巫。RTX 2080Ti已經(jīng)堪稱(chēng)功耗怪獸，TDP為250W，而WSE則需要15千瓦的供電。

性能參數

WSE包含40萬(wàn)個(gè)對AI優(yōu)化的計算核心，稱(chēng)為稀疏線(xiàn)性代數核心（SLAC），它靈活、可編程，并針對支持所有神經(jīng)網(wǎng)絡(luò )計算的稀疏線(xiàn)性代數進(jìn)行了優(yōu)化。

SLAC的可編程性確保內核可以在不斷變化的機器學(xué)習領(lǐng)域中運行所有神經(jīng)網(wǎng)絡(luò )算法。

由于稀疏線(xiàn)性代數核心針對神經(jīng)網(wǎng)絡(luò )計算基元進(jìn)行了優(yōu)化，因此它們可實(shí)現業(yè)界最佳利用率，通常是GPU的3~4倍。此外，WSE核心包括Cerebras發(fā)明的稀疏性收集技術(shù)，加速深度學(xué)習這類(lèi)稀疏工作負載的計算性能。

零在深度學(xué)習計算中很普遍。通常要相乘的向量和矩陣中的大多數元素都是零。然而乘以零會(huì )浪費計算資源。

史上最大AI芯片誕生：462平方厘米、40萬(wàn)核心，創(chuàng )下4項世界紀錄

通常GPU和TPU被設計為永不遇到零的計算引擎，它們即使有零也會(huì )乘以每個(gè)元素。當深度學(xué)習中50-98％的數據為零時(shí)，大多數乘法都被浪費了。

由于Cerebras稀疏線(xiàn)性代數核心不會(huì )乘以零，所有零數據都會(huì )被濾除，并且可以在硬件中跳過(guò)，從而可以用著(zhù)節約的資源去完成有用的工作。

內存是每個(gè)計算機體系結構的關(guān)鍵組件。更接近計算核心的緩存能帶來(lái)更低的延遲和更好的數據移動(dòng)效率。

高性能深度學(xué)習需要大量計算，并且頻繁訪(fǎng)問(wèn)數據。這需要計算核心和存儲器之間的緊密接近，但是在GPU中并非如此，大容量的顯存并不在GPU核心上，而是外置的。

WSE片上的緩存達到了18GB，是GPU緩存的3000倍；可提供每秒9PB的內存帶寬，比GPU快10,000倍。

Swarm是WSE上使用的處理器之間的通信結構，它只用傳統通訊技術(shù)功耗的幾分之一就實(shí)現了突破性的帶寬和低延遲。

Swarm提供低延遲、高帶寬的2D網(wǎng)格，可連接WSE上的所有40萬(wàn)個(gè)核心，帶寬為每秒100 petabits。WSE通信能量成本遠低于每比特1pJ，這比圖形處理單元低近兩個(gè)數量級。

面臨的問(wèn)題

為何其他芯片廠(chǎng)商不制造如此大尺寸的芯片呢？這是因為在制造晶圓的過(guò)程中不可避免會(huì )有一些雜質(zhì)，這些雜質(zhì)會(huì )導致芯片的故障。

通常的做法是將一片很大的晶圓切割成若干個(gè)小片，從中挑選出其中可用的部分，封裝成芯片，而將報廢部分丟棄。

而Cerebras的芯片已經(jīng)和晶圓面積差不多大了，是在一個(gè)晶圓上切割出一塊大的芯片，制造過(guò)程中不可避免會(huì )產(chǎn)生缺陷。

為了解決缺陷導致良率不高的問(wèn)題，Cerebras在設計的芯片時(shí)候考慮了1~1.5%的冗余，添加了額外的核心，當某個(gè)核心出現問(wèn)題時(shí)將其屏蔽不用，因此有雜質(zhì)不會(huì )導致整個(gè)芯片報廢。

史上最大AI芯片誕生：462平方厘米、40萬(wàn)核心，創(chuàng )下4項世界紀錄

Cerebras團隊遇到的另外一個(gè)問(wèn)題是芯片的刻蝕。今天的光刻設備仍然只能刻蝕面積較小的單個(gè)芯片。因此Cerebras與臺積電合作發(fā)明了新技術(shù)，來(lái)處理具有萬(wàn)億加晶體管芯片的刻蝕和通訊問(wèn)題。

即使芯片制造成功，接下來(lái)還要面臨三重挑戰：熱膨脹、封裝和冷卻。

Cerebras的芯片功率達15千瓦，與AI集群相當。給單個(gè)芯片提供巨大的功率，要考慮多方面的因素。

由于芯片在運行中會(huì )變得非常熱，但是不同材料的熱膨脹系數不同。這意味著(zhù)將芯片與PCB的熱膨脹系數不能差距太大，否則兩者之間產(chǎn)生裂縫。

Cerebras在芯片上方安裝了一塊“冷卻板”，使用多個(gè)垂直安裝的水管直接冷卻芯片。由于芯片太大而無(wú)法放入任何傳統封裝中，Cerebras還設計了結合了連接PCB和晶圓兩者的定制連接器以及冷卻裝置。

關(guān)于Cerebras

史上最大AI芯片誕生：462平方厘米、40萬(wàn)核心，創(chuàng )下4項世界紀錄

Cerebras公司由Sean Lie（首席硬件架構師）、Andrew Feldman（首席執行官）等人于2016年創(chuàng )立。后者曾創(chuàng )建微型服務(wù)器公司SeaMicro，并以3.34億美元的價(jià)格出售給AMD。

該公司在加州有194名員工，其中包括173名工程師，迄今為止已經(jīng)從Benchmark等風(fēng)投機構獲得了1.12億美元的投資。

參考資料：

https://www.pcworld.com/article/3432977/cerebras-systems-new-deep-learning-chip-is-as-big-as-your-keyboard-and-the-largest-ever.html

https://www.crunchbase.com/organization/cerebras-systems#section-overview

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： AI芯片

評論

相關(guān)推薦

曾號稱(chēng)碾壓英偉達！壁仞科技：?jiǎn)蝹€(gè)國產(chǎn)AI芯片不強但數量多、軟件加持就不一樣了

智能計算壁仞科技 AI芯片 chiplet | 2024-07-10

AI芯片供不應求，業(yè)界：半導體后端制程標準應統一

智能計算 AI芯片半導體后端制程標準 | 2024-07-24

比B200快10倍？AI芯片初創(chuàng )公司Etched沖擊英偉達

智能計算 B200 AI芯片英偉達 Etched | 2024-06-27

三星宣布獲首個(gè)2nm AI芯片訂單

EDA/PCB 三星 2nm AI芯片 | 2024-07-12

三星公布芯片制造技術(shù)路線(xiàn)圖，增強AI芯片代工競爭力

EDA/PCB 三星芯片制造 AI芯片代工 | 2024-06-13

瑞音創(chuàng )新性AI芯片助聽(tīng)器變聰明又便宜

醫療電子瑞音 AI芯片助聽(tīng)器 | 2024-06-22

三星2納米獲日AI芯片訂單

智能計算三星 2納米 AI芯片 | 2024-07-10

美媒曝英偉達超狂地位唯一弱點(diǎn)是這個(gè)　

智能計算英偉達 AI芯片 | 2024-07-07

NovuMind的AI芯片引發(fā)了爭議

謝丫丫 | 2018-10-25

中國臺灣AI芯片封裝領(lǐng)先全世界

EDA/PCB AI芯片封裝臺積電日月光 | 2024-07-07

軟銀收購英國AI芯片制造商Graphcore

智能計算軟銀 AI芯片 Graphcore | 2024-07-12

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>