平庸向左,黃仁勛向右
創(chuàng )立29年,英偉達每一步都走得難說(shuō)完美,但絕不平庸。
——
文|杜晨 編輯 | Vicky Xiao
1.
創(chuàng )立一家公司很容易,保持一家公司活著(zhù)很難。
為了讓曾經(jīng)多次處在存亡之際的英偉達能夠活下去,聯(lián)合創(chuàng )始人兼 CEO 黃仁勛 (Jensen Huang) 在過(guò)去的29年里曾經(jīng)做出許多在當時(shí)極具風(fēng)險的決定。
神奇的是,這些決定當中的絕大多數,最后竟然都被證明是正確的:從 TNT,到可編程 Shader(著(zhù)色器),再到 CUDA 架構以及其開(kāi)源和前向兼容,以及總是超過(guò)當前圖形市場(chǎng)主流應用場(chǎng)景需求的算力和存儲性能水平——這些關(guān)鍵的技術(shù)和產(chǎn)品,以及革新性的戰略決策,一次又一次將英偉達在計算市場(chǎng)的地位推至新高。
在營(yíng)銷(xiāo)策略助推下,今天的人們尊稱(chēng)黃仁勛為“AI教父”,夸張地將英偉達的圖形計算產(chǎn)品描述為“核彈”。然而實(shí)際上,黃仁勛并沒(méi)有什么封神的幻想——他做出的很多決定,完全是為了避免自己最害怕的事情發(fā)生:
英偉達淪為一家平庸的個(gè)人電腦零部件供應商。
“屏幕上就有那么多像素,芯片上能加的功能就那么多,但晶體管的數量還在不斷增加。這樣下去,在某個(gè)時(shí)間點(diǎn)上,圖形計算性能完全可以足夠任何人使用。你看今天各種集成顯卡,性能又好,又不要錢(qián),就會(huì )發(fā)現這個(gè)分析是完全正確的,”
“那么,如果我們不重新發(fā)明電腦圖形計算,不革自己的命,不徹底解放這塊圖形處理器的能力的話(huà),結局就是英偉達必然會(huì )被商品化 (commoditized)?!?/strong>
——黃仁勛,via Stratechery
帶著(zhù)這樣的恐懼,黃仁勛走上了一條自己革自己命的創(chuàng )業(yè)路。這條路,走到今天,已將近三十年。
2.
最近,英偉達召開(kāi)了年度技術(shù)大會(huì ) GTC 2022,發(fā)布了最新一代商用級 H100 GPU,和以知名計算機科學(xué)家 Grace Hopper 命名的 Hopper 架構。新架構采用臺積電4納米制程工藝,內存帶寬達到每秒3TB,在32和64位浮點(diǎn)計算上相比前一代 Ampere 架構的 A100 GPU 快了三倍。
H100 已經(jīng)成為最新一代“核彈”,但英偉達還有更多殺手锏:
通過(guò)最新的互聯(lián)技術(shù) NVLink 技術(shù),8張H100單卡連接構成了的 DGX H100 模組化超級計算機,算力達到了驚人的 1EFlops;而 NVLink Switch 技術(shù)在擴展性上也獲得了史詩(shī)級提升,支持最多256張 H100 GPU 互聯(lián)。
由于 GPU 進(jìn)行深度學(xué)習計算需要大量的內存帶寬,英偉達甚至和 ARM 合作開(kāi)發(fā)了一款采用全新 Grace 架構的 CPU,專(zhuān)門(mén)用來(lái)輔助 GPU 進(jìn)行帶寬分配,從而讓 GPU 可以全力開(kāi)動(dòng)進(jìn)行計算,不會(huì )因為在內存帶寬上受到限制而影響發(fā)揮。
早已在深度學(xué)習計算方面身位領(lǐng)先的英偉達,再一次打造了新的 GPU、CPU 架構、互聯(lián)技術(shù)。今天這家公司早已不再是單純的顯卡技術(shù)公司——它已經(jīng)將圖形加速計算的功力推到極限,為深度學(xué)習計算帶來(lái)了新的可能性。
在 GTC 大會(huì )上,黃仁勛認為人類(lèi)將會(huì )迎來(lái) AI 被 AI(而不只是人類(lèi))所創(chuàng )造出來(lái)的時(shí)代,并將其稱(chēng)為“生產(chǎn)智能”(intelligence manufacturing)。
會(huì )后,黃仁勛接受了 Stratechery 博客主筆/知名分析師 Ben Thompson 的采訪(fǎng)。特別的是,黃仁勛在這次采訪(fǎng)中談到了一些過(guò)去鮮少討論的話(huà)題——特別是對于公司平庸化的恐懼,以及英偉達三十年的創(chuàng )業(yè)路走到今天的感悟。
在他看來(lái),沒(méi)有比讓英偉達變成 “Wintel” 生態(tài)下的一家普通供應商更可怕的事情了。
2009年,黃仁勛在斯坦福大學(xué)做了一場(chǎng)名為“Vision Matters”的演講。其中,他回憶起了公司在2000年推出可編程像素著(zhù)色器(programmable pixel shader, 以下簡(jiǎn)稱(chēng)可編程 shader),在當時(shí)差點(diǎn)要了公司的命。
但是如果沒(méi)做那個(gè)決定,英偉達可能就不會(huì )獲得今天的行業(yè)地位。
作為獨立圖形處理器概念的主要推手,英偉達拿著(zhù)紅衫等投資者的2000多萬(wàn)美元苦心研發(fā) GPU 技術(shù),雖然頭兩款產(chǎn)品 NV1、NV2 GPU 都遭遇了失敗,還好 NV3(正式命名為 RIVA 128)由于技術(shù)相對先進(jìn)、價(jià)格低廉,推出不到1年就實(shí)現了100萬(wàn)枚出貨量。在 RIVA 128 打下的基礎上,英偉達又在次年推出了 RIVA TNT,性能顯著(zhù)優(yōu)于當時(shí)的競爭對手 3dfx 的產(chǎn)品,成功攬下當時(shí)多家顯卡廠(chǎng)商加入其陣營(yíng)。
RIVA 128 和 TNT 的優(yōu)秀戰績(jì),助推英偉達在1999年成功上市,然而當時(shí)的黃仁勛已經(jīng)不再看好這兩款產(chǎn)品所代表的技術(shù)理念了。
早年的 GPU 產(chǎn)品,包括 RIVA TNT 在內,都屬于固定功能的芯片。這類(lèi)芯片的優(yōu)勢就是運行固定功能的效率很高。
然而在黃仁勛看到的未來(lái)里,提升 GPU 的純粹性能將變得毫無(wú)意義。因為屏幕上的像素總量是有限的,一個(gè)處理器里能放進(jìn)去的既有功能也是有限的。結果就是,總有一天人們將會(huì )滿(mǎn)足于現有 GPU 的性能,不再需要更新更快的 GPU……屆時(shí),英偉達將會(huì )淪為一家平庸的 PC 零部件供應商。
于是,黃仁勛開(kāi)始了英偉達的第一次“離經(jīng)叛道”:推出了可編程 shader。
英偉達這樣做的背后理念,就是改變 GPU 作為固定功能處理器的身份,將它變成一個(gè)可編程的處理器,讓用戶(hù)可以在英偉達 GPU 上做更多創(chuàng )意工作,包括3D渲染、特效制作、游戲開(kāi)發(fā)等——這樣,英偉達 GPU 的用戶(hù)將不僅僅是普通消費者,也將包括開(kāi)發(fā)者。
3.
這次轉型差點(diǎn)要了英偉達的命,不是因為這個(gè)方向錯了——它是正確的,只是發(fā)生得太早了。
前面提到,面向特定功能設計的處理器運行起來(lái)效率高,而如果要把 GPU 做成可編程的,則 GPU 的運行效率會(huì )比之前低,而且要在算力、內存等各方面的增加額外成本。
英偉達把可編程 shader 及適配顯卡做出來(lái)了,可是圖形開(kāi)發(fā)者還沒(méi)有準備好為未來(lái)買(mǎi)單。他們所開(kāi)發(fā)的游戲和圖形計算應用,在當時(shí)還無(wú)法從可編程 shader 技術(shù)中獲益。結果就是,英偉達搞的新技術(shù)和產(chǎn)品很好很強大,從消費者的視角來(lái)看卻過(guò)于昂貴且沒(méi)用。
“這個(gè)處理器架構是全新的,可編程像素 shader 在過(guò)去從來(lái)沒(méi)有過(guò),可編程的 GPU 處理器和編程模型也前所未有——所有這些尷尬的現實(shí),我們都只能咽到肚子里?!秉S仁勛說(shuō)。

"咽下去之后,我們接下來(lái)組建了編譯器團隊,研究 SDK和庫,到處去找開(kāi)發(fā)者去跟他們安利我們的新架構,讓他們意識到這套東西的好處——我們甚至要自己動(dòng)手開(kāi)發(fā)庫,拿給開(kāi)發(fā)者看把他們的應用導入到我們這里有多容易、有哪些好處;我們甚至用了市場(chǎng)營(yíng)銷(xiāo)的預算,幫開(kāi)發(fā)者營(yíng)銷(xiāo)他們用我們架構開(kāi)發(fā)的新產(chǎn)品,來(lái)創(chuàng )造市場(chǎng)需求……"
久而久之,英偉達不再是一家硬件公司了??梢哉f(shuō)它是為了體面地活下去,而不得不實(shí)現了“硬件技術(shù)+軟件體驗+開(kāi)發(fā)生態(tài)”垂直整合的技術(shù)平臺公司。
后來(lái)的 GeForce、CUDA、Tensor Core 等,每一個(gè)在英偉達公司技術(shù)發(fā)展歷程上寫(xiě)下濃墨重彩一筆的技術(shù),從某些角度上都和可編程 shader 相似:超前的技術(shù)能力、較高的可編程自由度、面向生態(tài)合作伙伴開(kāi)放的商業(yè)模式等。
但與此同時(shí),它們其實(shí)都是黃仁勛為了避免英偉達走向平庸而決定推出的。如果沒(méi)有 Shader、CUDA、RTX、DGX 等這些在各自的誕生時(shí)間點(diǎn)上顯得“離經(jīng)叛道”的技術(shù),今天的英偉達恐怕早已淪為一家普通的顯卡公司,和今天掛著(zhù) GeForce 的名號生產(chǎn)顯卡的那些我們耳熟能詳的品牌,沒(méi)有多少不同。
4.
英偉達最近幾年全力投入 AI 技術(shù)的支持,同樣是避免公司走向平庸的結果。
按黃仁勛的說(shuō)法,英偉達公司歷史上幾次具有里程碑意義的關(guān)鍵技術(shù)推出,背后其實(shí)都是對自家 GPU 技術(shù)的發(fā)展成果進(jìn)行了“泛化”(generalize),然后發(fā)現居然它可以做更多不同的事情。
結果就是,英偉達在不斷遷移和泛化 GPU 能力的過(guò)程中,建立了一套全新的,基于 GPU 技術(shù)的計算機科學(xué)架構。
而當人工智能時(shí)代來(lái)臨的時(shí)候,英偉達搭建好的這套新架構非常適合用來(lái)加速深度學(xué)習方面的任務(wù)。
正是在這樣的條件下,黃仁勛從之前的顯卡大王變成了如今的 “AI教父”。但如果有人以為英偉達只是碰巧趕上這波 AI 的浪潮,那他就大錯特錯了。
早在十年前,黃仁勛就已經(jīng)相信,圖形計算加速成就了早年的英偉達那樣,而新時(shí)代的英偉達應該全力投入到 AI 計算的加速上,而且沒(méi)有別的公司比英偉達更適合做這件事。
一個(gè)最典型的例子就是機器人 (robotics)。黃仁勛表示:“一個(gè)經(jīng)典的機器人問(wèn)題,涉及感知、推理、規劃,以及之后許許多多的不同任務(wù)。這些任務(wù)涉及多個(gè)傳感器的大量實(shí)時(shí)數據;并且出于多元化和冗余的目的,處理器需要用不同的算法進(jìn)行處理?!?/span>這些任務(wù)的特性,正好是英偉達的 GPU 架構所擅長(cháng)的。
包括 AI、自動(dòng)駕駛、數據中心/高性能計算、超級計算機、工業(yè)邊緣計算、元宇宙相關(guān)的融合現實(shí)互動(dòng)技術(shù)等等……現在如果我們去英偉達的網(wǎng)站上,會(huì )看到這家公司簡(jiǎn)直無(wú)所不做,早已不是大部分普通消費者用戶(hù)所認識的那家顯卡公司了。
這些較新的業(yè)務(wù),都可以被視為英偉達避免平庸而不斷突破自己邊界的體現。
在采訪(fǎng)中,黃仁勛說(shuō)自己這一生最大的禮物,就是身邊有著(zhù)一群世界上最富有才能的同事。而他自己最大的才能,是堅韌不拔。
“我堅持這條路的時(shí)間比其他人都長(cháng),但那只是因為我有耐心而已。只要我選定了一條道路,我能夠一直在上面走很長(cháng)很長(cháng)的時(shí)間。這就是我的耐心?!?/span>
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。