中國芯片與摩爾定律
本周二,拜登政府收緊了對銷(xiāo)往中國的先進(jìn)人工智能(AI)芯片的出口管制;主要目標是英偉達(Nvidia)的 H800 和 A800 芯片,這些芯片是專(zhuān)門(mén)為規避去年實(shí)施的控制而設計的。H800/A800 和 H100/A100 之間的主要區別在于它們的通信帶寬:A100 具有 600 Gb/s 的速度(H100 具有 900GB/s),這恰好是去年出口管制所禁止的限制,A800 和 H800 的通信速度僅限于 400 Gb/s。
本文引用地址:http://dyxdggzs.com/article/202310/451870.htm通信速度之所以重要,與 Nvidia 首席執行官黃仁勛 (Jensen Huang) 的論點(diǎn)「摩爾定律已死」有關(guān)。摩爾定律最初于 1965 年提出,指出集成電路中晶體管的數量每年都會(huì )增加一倍。十年后,戈登·摩爾將他的預測修正為每?jì)赡攴环?,直到過(guò)去十年左右,這一預測才放緩至大約每三年翻一番。
但在實(shí)踐中,摩爾定律已經(jīng)變得更類(lèi)似于科技行業(yè)的基本法則:隨著(zhù)時(shí)間的推移,計算能力將會(huì )增加,而且會(huì )變得更便宜。這一原則與戈登·摩爾的技術(shù)預測相關(guān):較小的晶體管可以更快地切換,并且在切換時(shí)使用更少的能量,即使更多的晶體管可以集成在單個(gè)晶圓上;這意味著(zhù)您可以在每個(gè)晶圓上獲得更多芯片或更大的芯片,從而降低價(jià)格或以相同的價(jià)格提高功率。在實(shí)踐中我們兩者都得到了。
至關(guān)重要的是,科技行業(yè)的其它公司不需要了解摩爾定律的技術(shù)或經(jīng)濟細節:60 年來(lái),簡(jiǎn)單地假設計算機會(huì )變得更快是安全的,這意味著(zhù)最佳方法始終是專(zhuān)為尖端或超越而構建,并相信處理器速度能夠趕上您的使用案例。
摩爾定律終結?
近幾年,英偉達首席執行官黃仁勛一再宣稱(chēng)摩爾定律已死。從技術(shù)角度來(lái)看,速度確實(shí)放緩了,但密度在持續增加。以下是臺積電按制程節點(diǎn)尺寸劃分的晶體管密度,以每個(gè)節點(diǎn)尺寸的第一代工藝為例。
請記住,成本很重要,以下是臺積電每晶圓介紹價(jià)格的同一張表,以及每十億個(gè)晶體管的價(jià)格:
請注意右下角的數字:采用臺積電的 5 nm 工藝,每個(gè)晶體管的價(jià)格上漲了,而且上漲了很多 (20%)。原因很明顯:5nm 是第一個(gè)需要 ASML 極紫外 (EUV) 光刻技術(shù)的工藝,而 EUV 機器非常昂貴——每臺約 1.5 億美元。換句話(huà)說(shuō),雖然摩爾定律的技術(shù)定義將繼續存在,但芯片總是變得更快、更便宜的原則卻不會(huì )繼續存在。
GPU 和令人尷尬的并行性
需要明確的是,黃仁勛的論點(diǎn)并不僅僅基于 5nm 芯片的成本,摩爾定律涉及速度和成本,而事實(shí)是,隨著(zhù)能源成為從移動(dòng)設備到個(gè)人電腦再到數據中心的所有設備的限制,許多密度增益主要用于提高電源效率。黃仁勛多年來(lái)的論點(diǎn)是,Nvidia 擁有提高計算速度的解決方案:使用 GPU。
GPU 比 CPU 簡(jiǎn)單得多;這意味著(zhù)它們可以更快地執行指令,但這些指令必須更簡(jiǎn)單,可以同時(shí)運行許多它們以獲得巨大的結果。不出所料,圖形是最明顯的例子:每個(gè)「著(zhù)色器」——GPU 的主要處理組件——計算將在屏幕的單個(gè)部分上顯示的內容,該部分的大小是可用著(zhù)色器數量的函數。如果您有 1024 個(gè)著(zhù)色器,則每個(gè)著(zhù)色器繪制屏幕的 1/1024。因此,如果您有 2048 個(gè)著(zhù)色器,則繪制屏幕的速度可以提高兩倍。圖形性能是「令人尷尬的并行」,也就是說(shuō)它隨著(zhù)解決問(wèn)題的處理器數量而變化。
這種「令人尷尬的并行性」是 GPU 相對于 CPU 具有超強性能的關(guān)鍵,但挑戰在于并非所有軟件問(wèn)題都可以輕松并行化;Nvidia 的 CUDA 生態(tài)系統旨在提供工具來(lái)構建可以利用 GPU 并行性的軟件應用程序,并且是鞏固 Nvidia 主導地位的主要護城河之一,但大多數軟件應用程序仍然需要 CPU 才能運行。
事實(shí)證明,無(wú)論是在訓練模型還是在推理模型方面,人工智能都是一個(gè)令人尷尬的并行應用程序。此外,最佳的可擴展性遠遠超出了計算機顯示器顯示圖形的范圍。這就是為什么 Nvidia AI 芯片具有芯片禁令所提到的高速互連功能:AI 應用程序同時(shí)在多個(gè) AI 芯片上運行,但確保這些 GPU 繁忙的關(guān)鍵是向它們提供數據,而這需要那些高速互連。
話(huà)雖如此,我對傳統數據中心應用程序大規模轉向 GPU 持懷疑態(tài)度。
基于 CPU 的應用程序不僅更容易開(kāi)發(fā),而且大多已經(jīng)構建完成。我很難想象哪些公司會(huì )花費時(shí)間和精力將已經(jīng)在 CPU 上運行的東西移植到 GPU 上;歸根結底,在云中運行的應用程序是由提供云資源需求的客戶(hù)決定的,而不是尋求優(yōu)化 FLOP/rack 的云提供商。
認為傳統 CPU 仍有一定生命力的另一個(gè)原因是:事實(shí)證明摩爾定律可能又回到了正軌。
EUV 和摩爾定律
上文所示表格只跑到 5nm,iPhone 15 Pro 采用的是 N3 芯片,以下為相應的價(jià)格/晶體管表。
雖然我之前只給出了每個(gè)節點(diǎn)的第一個(gè)版本,但用于 iPhone A17 Pro 芯片的 N3B 工藝是一個(gè)死胡同;臺積電改變了 N3E 的做法,這將成為未來(lái) N3 系列的基礎。這也使得 N3 在每晶體管價(jià)格方面的飛躍更加令人印象深刻:N3B 消除了 5nm 的倒退,N3E 比 7nm 有了顯著(zhù)的改進(jìn)。
此外,EUV 機器成本很高,但摩爾定律中的價(jià)格下降并不是設備變得更便宜的結果。請注意,每片晶圓的價(jià)格一直在不斷上漲。相反,不斷下降的價(jià)格/晶體管是摩爾定律的函數,也就是說(shuō),EUV 等新設備讓我們「將更多元件填充到集成電路上」。
5nm 發(fā)生的情況與 20nm 每晶體管價(jià)格上漲的情況類(lèi)似:那是臺積電開(kāi)始使用雙圖案化的節點(diǎn),這意味著(zhù)他們必須將每個(gè)光刻步驟進(jìn)行兩次;這既使每片晶圓的光刻設備利用率增加了一倍,同時(shí)也降低了產(chǎn)量。至少對于該節點(diǎn)來(lái)說(shuō),制造更小的晶體管所帶來(lái)的收益超過(guò)了成本。然而一年后,臺積電推出了 16nm 節點(diǎn)。這正是 3nm 所發(fā)生的情況——EUV 的收益現在明顯超過(guò)成本——而有關(guān) 2nm 密度和價(jià)格點(diǎn)的早期傳言表明,另一個(gè)節點(diǎn)的收益應該會(huì )持續下去。
芯片禁令
考慮到華盛頓特區對華為最近推出的配備 7nm 芯片的智能手機感到焦慮,這似乎是對出口管制的蔑視。
簡(jiǎn)而言之,芯片禁令的問(wèn)題在于在 10nm 上劃定界限:這條界限是任意的,因為制造 10 nm 芯片所需的設備已經(jīng)被證明能夠生產(chǎn) 7 nm 芯片。
真正重要的是 5nm,換句話(huà)說(shuō),真正限制中國大陸長(cháng)期發(fā)展的出口管制是 EUV。前些年,特朗普政府已經(jīng)說(shuō)服荷蘭不允許出口 EUV 設備,拜登政府通過(guò)芯片禁令以及與荷蘭的進(jìn)一步協(xié)調進(jìn)一步鎖定了 EUV 的出口?,F實(shí)情況是,很多芯片制造設備都是「多節點(diǎn)」的;許多機器可以在多個(gè)節點(diǎn)上使用,但您必須擁有 EUV 設備才能延續摩爾定律,因為它是驅動(dòng)摩爾定律的關(guān)鍵技術(shù)。
H800 是臺積電第三代 5nm 工藝(容易混淆的 N4)制造的,也就是說(shuō)它是用 EUV 制造的;通信速度限制是有意義的,并且會(huì )使人工智能開(kāi)發(fā)速度更慢、成本更高。
這引出了進(jìn)一步的觀(guān)點(diǎn):芯片禁令的回報不會(huì )立即顯現。整個(gè)想法有意義的唯一方法是摩爾定律是否繼續存在,因為這意味著(zhù)五年或十年后可用的芯片將比現在存在的芯片更快、更便宜,從而擴大差距。同時(shí),這個(gè)想法也取決于認真對待黃的論點(diǎn),因為人工智能不僅需要力量,還需要規模。幸運的是,兩條戰線(xiàn)的進(jìn)展都朝著(zhù)正確的方向發(fā)展。
反對芯片禁令也存在很好的論據,包括一個(gè)明顯的事實(shí),即中國大陸受到強烈激勵從頭開(kāi)始建立替代品。也許在 20 年內,美國不僅會(huì )失去最有力的杠桿點(diǎn),而且還將看到其最前沿的公司被中國的競爭削弱。
評論