大算力芯片,正在擁抱Chiplet
在和業(yè)內人士交流時(shí),有人曾表示:「要么業(yè)界采用 Chiplet 技術(shù),維持摩爾定律的影響繼續前進(jìn),要么就面臨商業(yè)市場(chǎng)的損失?!闺S著(zhù)摩爾定律走到極限,Chiplet 被行業(yè)普遍認為是未來(lái) 5 年算力的主要提升技術(shù)。
本文引用地址:http://dyxdggzs.com/article/202404/457250.htm戰場(chǎng)已拉開(kāi),紛爭開(kāi)始了
Chiplet 不算是新的技術(shù),但是這股浪潮確實(shí)是近年來(lái)開(kāi)始火熱的。
什么是 Chiplet?
Chiplet 俗稱(chēng)芯粒,也叫小芯片,它是將一類(lèi)滿(mǎn)足特定功能的 die(裸片),通過(guò) die-to-die 內部互聯(lián)技術(shù)實(shí)現多個(gè)模塊芯片與底層基礎芯片封裝在一起,形成一個(gè)系統芯片,以實(shí)現一種新形式的 IP 復用。
簡(jiǎn)單來(lái)說(shuō),可以理解為將每個(gè)小的芯片用「膠水」縫合在一起,形成一個(gè)性能更強的大芯片。這也不算是一個(gè)新鮮的技術(shù),例如:英特爾將兩個(gè)芯片(一個(gè) CPU 和一個(gè)用于 CPU 大型 L2 高速緩存的快速靜態(tài)內存芯片)放在一起,放入公司于 1995 年末推出的 Pentium Pro CPU 的封裝中。
也許去年,大部分廠(chǎng)商還沉浸在 Chiplet 技術(shù)的未來(lái)應用上,那到了今天 Chiplet 已經(jīng)成為各大廠(chǎng)商的產(chǎn)品中的必選角色。
首先來(lái)看 AMD,AMD 是選擇 Chiplet 最積極的廠(chǎng)商之一。
在 2019 年的時(shí)候,AMD 就初次嘗試了 Chiplet 封裝,將不同工藝節點(diǎn)的 CPU 內核且 I/O 規格不同的芯片封裝在一起,顯著(zhù)提高了能效和功能。
之后,AMD 又發(fā)布了實(shí)驗性產(chǎn)品,即基于 3D Chiplet 技術(shù)的 3D V-Cache。使用的處理器芯片是 Ryzen 5000,采用臺積電 3D Fabric 先進(jìn)封裝技術(shù),成功地將包含有 64MB L3 Cache 的 Chiplet 以 3D 堆疊的形式與處理器封裝在了一起。
從數據性能來(lái)看,采用 3D Chiplet 的原型芯片將性能平均提高了 12%。從這一點(diǎn)上,也能看到 3D Chiplet 對實(shí)際工作負載的提升有實(shí)質(zhì)性的貢獻。
不止在 CPU,AMD 在 GPU 方面也選擇了 Chiplet 技術(shù)。目前,AMD 發(fā)布的最新 MI300 系列芯片時(shí),同樣采用 Chiplet 技術(shù),8 個(gè) GPU Chiplet 加 4 個(gè) I/O 內存 Chiplet 的設計,總共 12 個(gè) 5nm Chiplet 封裝在一起,使其集成的晶體管數量達到了 1530 億,高于英偉達 H100 的 800 億晶體管。這款芯片在推出時(shí),也是打出了對標英偉達 H100 的口號。
此外,AMD 含 Chiplet 技術(shù)的 CPU 銷(xiāo)量占比也在不斷提高。根據德國電腦零售商 Mindfactory 數據,2021 年 10 月至 2022 年 12 月間 AMD CPU 的銷(xiāo)量中,含 Chiplet 技術(shù)的 CPU 銷(xiāo)量占比不斷提高,從約 80% 上升至約 97%。
再來(lái)看英特爾。英特爾的首次推出基于 Chiplet 設計的處理器是 Sapphire Rapids,時(shí)間在 2023 年 1 月。
具體來(lái)看,通過(guò)兩組鏡像對稱(chēng)的相同架構的 building blocks,組合 4 個(gè) Chiplets,獲得 4 倍的性能和互聯(lián)帶寬。每個(gè)基本模塊包含計算部分(CHA & LLC & Cores mesh,Accelerators)、memory interface 部分(controller,Ch0/1)、I/O 部分(UPI,PCIe)。通過(guò)將上述高性能組件組成基本的 building block,再通過(guò) EMIB 技術(shù)進(jìn)行 Chiplet 互聯(lián),可以獲得線(xiàn)性性能提升和成本收益。
最后,來(lái)看英偉達。英偉達坐穩 GPU 領(lǐng)域霸主這一點(diǎn)毋庸置疑,而霸主英偉達在今年推出的「最強」GPU B200 也同樣采用 Chiplet 技術(shù)。GB200 超級芯片是由 2 顆 B200 GPU 和 1 顆 Arm 架構的 Grace CPU(中央處理器)組合而來(lái)。
由此可見(jiàn),英特爾、AMD、英偉達都在自家的 CPU、GPU 上使用了 Chiplet 技術(shù)。這將 Chiplet 推入了一個(gè)全新的商業(yè)化階段。
Chiplet 這一錘,算是重重砸下了。
Chiplet 從 CPU 到 GPU
在之前傳統的 GPU 也是由一個(gè)中央工作負載處理器,將渲染任務(wù)發(fā)送到芯片內的多個(gè)著(zhù)色器塊之一。每個(gè)單元都被賦予一塊幾何體來(lái)處理、轉換為像素,然后對它們進(jìn)行著(zhù)色。
后來(lái) AMD 發(fā)現,Chiplet 用在 CPU 上效果很好,并且降低了制造成本。于是在 GPU 上也選擇了放棄中央處理器,用多個(gè)小芯片取代單個(gè)硅塊,每個(gè)小芯片處理自己的任務(wù)。渲染指令以稱(chēng)為命令列表的長(cháng)序列發(fā)送到 GPU,其中所有內容都稱(chēng)為繪制調用。

AMD 2019 年 Chiplet 專(zhuān)利
該文件于 2019 年 6 月發(fā)布,即提交近兩年后,該功能已在 RDNA 2 中實(shí)現。AMD 于 2020 年開(kāi)始推廣該架構,并于同年 11 月推出了首款配備全新 RT-texture 處理器的產(chǎn)品。

不同制程及封裝技術(shù)下的芯片良率、成本、面積的關(guān)系 注:D 為缺陷密度,c 為負二項分布中的集群參數或 Seed』s model 中臨界值數量
摩爾定律沒(méi)死,但確實(shí)是老了,在 14nm 之后成本曲線(xiàn)就變了。5nm 工藝的成本相比 7nm 工藝增長(cháng)了近 1 倍,3nm 工藝相比 5nm 工藝預計將增長(cháng)近 1 倍。在半導體工藝、規模限制越來(lái)越大的情況下,傳統大芯片的策略確實(shí)是寸步難行。
總體來(lái)看,Chiplet 有四大優(yōu)點(diǎn):
第一,通過(guò)將功能塊劃分為小芯片,那么不需要芯片尺寸的持續增加。這就提高了良率并簡(jiǎn)化了設計和驗證的流程。
第二,每個(gè)小芯片是獨立的,那就可以選擇最佳工藝。邏輯部分可以采用尖端工藝制造,大容量 SRAM 可以使用 7nm 左右的工藝制造,I/O 和外圍電路可以使用 12nm 或 28nm 左右的工藝制造,這就大大降低了制造的成本。
第三,組合多樣,適合定制化,輕松制造衍生類(lèi)型。比如說(shuō)采用相同的邏輯電路但是不一樣的外圍電路,或相同外圍電路但不同的邏輯電路。
第四,不同制造商的小芯片可以混合使用,而不僅僅是局限在單個(gè)制造商內。
這些特點(diǎn)都非常適合用在大算力芯片上。相較于傳統消費級芯片,算力芯片面積更大,存儲容量更大,對互連速度要求更高。采用 Chiplet 既可以降低成本提升良率,又可以允許更多計算核心的「堆料」,還能便于引入 HBM 存儲。
越接近摩爾定律極限如 5nm、3nm 和 2nm 的芯片走 Chiplet 設計路線(xiàn)越有意義。
清華大學(xué)交叉信息研究院特聘研究員、助理教授馬愷聲也分析過(guò),到底什么樣的芯片適合使用 Chiplet:「具體到芯片應用來(lái)說(shuō),CPU 和 GPU 這種大芯片是適合的,對于大芯片來(lái)說(shuō),建議是超過(guò) 200 平方毫米,最好是超過(guò) 400 平方毫米的是適合做 Chiplet 的;如果僅從成本角度看,如 MCU 這樣本身價(jià)格較低的芯片目前是沒(méi)有必要的?!?/p>
我們也能看到,Chiplet 技術(shù)在 CPU 和 GPU 上的商用確實(shí)比較順利。
Chiplet 時(shí)代,代工廠(chǎng)偷偷賺大錢(qián)
Chiplet 制造步驟相對于封裝復雜度大幅提升,同時(shí)考慮到不同的連接方式對于精度的要求和工藝要求不同,制造過(guò)程分布在 IDM、晶圓廠(chǎng)和封裝廠(chǎng)。
這給臺積電、英特爾帶來(lái)了商機。
3nm 制程技術(shù)占據了臺積電晶圓總收入的 6%,5nm 和 7nm 分別占晶圓總收入 33% 和 19%。先進(jìn)制程(7nm 及以下)占臺積電晶圓總收入的比重達到了 58%。
前文提到的 AMD 發(fā)布的 3D V-Cache 實(shí)驗性產(chǎn)品背后,是臺積電的先進(jìn)半導體工藝技術(shù)和先進(jìn)封裝技術(shù)。臺積電作為同時(shí)掌握了最先進(jìn)半導體工藝和封裝技術(shù)的代工廠(chǎng),其全球最頂尖代工廠(chǎng)的地位得到了鞏固,同時(shí)其在先進(jìn)技術(shù)領(lǐng)域也將變得更加強勢。
那么臺積電的 7m、5nm 可以得到更好地利用。如果仔細來(lái)看臺積電的營(yíng)收,在先進(jìn)制程方面的收入使得其業(yè)績(jì)一路高升。
不過(guò),對于臺積電來(lái)說(shuō),Chiplet 也帶來(lái)了新的挑戰。通過(guò)采用 Chiplet,臺積電避免了傳統的壟斷模式,使客戶(hù)理論上能夠從多個(gè)來(lái)源獲得其芯片。這增加了客戶(hù)的選擇自由度,促使了更加競爭激烈的市場(chǎng)環(huán)境。
不同于 AMD 和英偉達,英特爾一直在發(fā)展其 IDM 2.0 的戰略,將晶圓代工看得非常重要。
從代工這方面來(lái)看,Chiplet 對于英特爾也有不一樣的影響。
一方面,英特爾承諾過(guò)的 4 年交付 5 個(gè)工藝節點(diǎn)(intel 7、intel 4、intel 3、intel 20A、intel 18A),如果使用 Chiplet,那么英特爾可以避免為復雜的 CPU 或 GPU 執行完整工藝所需的困難。
另一方面,英特爾還可以利用混合制造廠(chǎng)商(使用來(lái)自多個(gè)代工廠(chǎng)的 Chiplet 并將其打包)的概念來(lái)獲得代工廠(chǎng)商機。在去年,英特爾宣布與臺積電攜手打造全球首款符合 Chiplet 互連產(chǎn)業(yè)聯(lián)盟(UCIe)標準的多芯片封裝芯片,當中包含英特爾與臺積電各自生產(chǎn)的 IC。
值得注意的是,英特爾是第一個(gè)主動(dòng)選擇,多源代工業(yè)務(wù)模式的廠(chǎng)商。
結語(yǔ)
Chiplet 的探索正在圍繞著(zhù) CPU 和 GPU 這兩大領(lǐng)域,但從長(cháng)遠來(lái)看,隨著(zhù) Chiplet 產(chǎn)業(yè)鏈更加成熟,Chiplet 的發(fā)展將不局限于這類(lèi)大芯片,而是會(huì )有更廣闊的運用空間。
Chiplet 的風(fēng)行,也讓半導體產(chǎn)業(yè)必須有所調整,以建構出對應的完善生態(tài)系統。目前市場(chǎng)上的 Chiplet 產(chǎn)品,是各家大廠(chǎng)自行發(fā)展出來(lái)的成果,故目前半導體業(yè)內存在多種不相通的 Chiplet 互連技術(shù),導致 Chiplet 生態(tài)系呈現碎片化的局面。
目前在底層封裝層面,已經(jīng)有臺積電、英特爾等廠(chǎng)商提供 CoWOS、EMIB 等先進(jìn)封裝,可以提供超高速、超高密度和超低延時(shí)的 Chiplet 互聯(lián);在標準協(xié)議層面,也有眾多大廠(chǎng)領(lǐng)銜發(fā)布的 UCIe 1.0 版本,提供了跨片接口設計的指導和約束。
Chiplet 的春風(fēng)在吹了。
評論