問(wèn): 英偉達(NVDA)近期上攻$1000的高位后,多空分歧開(kāi)始劇烈,不少人拿出當年互聯(lián)網(wǎng)泡沫時(shí)Cisco的尖峰圖做對比。 您怎么看?答: 但在大多數情況下,用舊數據來(lái)短期預測股市是意義不大的:因為變量太多,情況完全復刻的概率極低。但是,分析科技股一定是要分析其未來(lái)數十年的發(fā)展邏輯,而且這個(gè)邏輯是相通的。問(wèn): 但是,市面上就沒(méi)幾個(gè)人把英偉達的邏輯說(shuō)清楚的。至少我沒(méi)看到。答: 看清英偉達的邏輯確實(shí)相對門(mén)檻比較高,它至少有三層:- 總AI市場(chǎng)需求(TAM)夠不夠大?這個(gè)生意能賺多少年?
- 英偉達現在爆好的業(yè)務(wù)會(huì )不會(huì )曇花一現?大廠(chǎng)們完成硬件軍備競賽完成后不再需要采購了?
- 英偉達的護城河夠深嗎?未來(lái)競爭對手能搶走多少份額?
問(wèn): 我知道科技股巨頭絕大多數有個(gè)特點(diǎn),就是有所謂的“護城河”。但英偉達這個(gè)護城河是怎么回事,道上各種神仙妖魔經(jīng)常是亂吹一氣,實(shí)在不知道應該聽(tīng)誰(shuí)的。答: 我一直這樣認為,科技公司的護城河,大多是軟硬一體的,這樣就可以持續半個(gè)世紀以上。純軟件或純硬件成功的公司肯定也有,但不影響我的核心觀(guān)點(diǎn)。問(wèn): 您能給出一些例子嗎?答: 我從過(guò)去50年每個(gè)十年分別找出個(gè)例子,來(lái)做一下說(shuō)明。 1970年代最重要的軟件技術(shù)是關(guān)系型數據庫,我們簡(jiǎn)稱(chēng)SQL吧。SQL使得企業(yè)的信息化啟動(dòng)了,手寫(xiě)帳變成了電子賬,帶來(lái)第一個(gè)萬(wàn)億級賽道。我們要提的這家軟硬一體公司,就是IBM。IBM的工作,簡(jiǎn)單說(shuō),就是給企業(yè)用上SQL,配上IBM的主機。1980年代,大家都聽(tīng)過(guò)神奇CEO帶著(zhù)IBM大象跳舞,其實(shí)主要是職業(yè)經(jīng)理人的自我吹噓。所謂跳舞就是砍掉硬件轉型服務(wù),而事實(shí)是主機是IBM真正的護城河,它根本沒(méi)被砍,裝SQL的“服務(wù)”業(yè)務(wù)是市場(chǎng)爆炸需求,也不是職業(yè)經(jīng)理人發(fā)明的。IBM主機業(yè)務(wù)50年經(jīng)久不衰,我們大家的存款大多還是IBM主機管著(zhù)。雖然很多人都以為IBM已經(jīng)完蛋了,但它的股價(jià)其實(shí)現在是創(chuàng )新高的。 1980年代最重要的軟件技術(shù)是圖形界面,我們簡(jiǎn)稱(chēng)GUI吧。GUI使得PC爆發(fā)增長(cháng)成為每個(gè)人的工具,這里的代表公司是WINTEL。微軟和英特爾確實(shí)是兩家公司,但由于兩家是事實(shí)上PC標準的制定者而軟硬件深度綁定。他們的成功也持續至今,雖然英特爾近幾年碰到不少問(wèn)題但在PC領(lǐng)域仍是領(lǐng)頭羊。 1990年代最重要的軟件技術(shù)是萬(wàn)維網(wǎng),我們簡(jiǎn)稱(chēng)WWW吧。WWW中最重要的軟硬件一體公司是思科(CSCO),思科從那時(shí)至今仍是互聯(lián)網(wǎng)后臺最重要的公司,我們如果除去2000年泡沫的尖峰,思科的股價(jià)其實(shí)也是穩步向上的狀態(tài)。也就是說(shuō),和IBM類(lèi)似,思科的核心生意從那時(shí)開(kāi)始一直賺錢(qián)至今,只是這個(gè)生意沒(méi)大家想象的那么大,換機頻率比較低。思科曾有個(gè)巨大的失誤,就是其終端路由器WRT54G錯誤地選用了Linux,因GPL協(xié)議的原因被迫公布了源代碼,這導致所有公司一下子都會(huì )做普通路由器了。如果思科當時(shí)像蘋(píng)果MacOS那樣選FreeBSD,這個(gè)軟硬一體恐怕還能多賺很多錢(qián)。 2000年代最重要的軟件技術(shù)是虛擬化,也叫Hypervisor。這里面最出名的公司是VMWare,它的最核心產(chǎn)品其實(shí)是服務(wù)器底層(Bare-Metal)操作系統。VMWare的軟件非常非常優(yōu)秀,但它缺乏深度的硬件綁定自身難以成為超級巨頭,反而被硬件公司買(mǎi)來(lái)賣(mài)去的。最終成功應用虛擬化做到軟硬一體的公司,是亞馬遜、谷歌和微軟,他們使得互聯(lián)網(wǎng)變成工作生活必須的基礎設施,給你提供各種信息和商品。 2010年代最重要的軟件技術(shù)是移動(dòng)操作系統,iOS和Android。蘋(píng)果做到iOS軟硬件一體而賺走了手機業(yè)90%的利潤,這里不用多講吧。 2020年代最重要的軟件技術(shù)顯然是大語(yǔ)言模型,我們簡(jiǎn)稱(chēng)LLM。問(wèn): 您之前列的那些軟硬件一體,都是奔著(zhù)持續掙50年大錢(qián)的,我承認。但是LLM真的能和那些前輩相提并論嗎?答: 答案是肯定的。這就是看多英偉達的第一層,而且我相信華爾街也達成了共識,所以才會(huì )瘋狂追捧。 Hinton說(shuō),GenAI(LLM)標志了仿生智能(連接派)在與符號邏輯智能(符號派)的競爭中勝出。而這個(gè)勝出一下子為后面AI代替人的幾乎所有事情畫(huà)清了路線(xiàn)圖,甚至人無(wú)法做的那些事機器如何做也都有了眉目。 黃仁勛說(shuō),人的DNA序列也是個(gè)語(yǔ)言,我們還不知道它是什么意思,形成的各種蛋白作用是什么,但LLM未來(lái)大概率可以告訴我們。這為未來(lái)的醫學(xué)打開(kāi)了一扇巨大的門(mén)。 簡(jiǎn)單說(shuō),過(guò)不了幾年LLM就是任何人不可缺少的隨身伴侶,普通人花十幾年的巨額代價(jià)學(xué)外語(yǔ)學(xué)數理化都將變得沒(méi)有意義。問(wèn): 停!你吹了半天LLM,可英偉達不是做LLM的呀,你不是說(shuō)軟硬件一體么,而且訓練LLM的GPU,好多家都能做呢。另外,英偉達這幾個(gè)季度業(yè)績(jì)超預期,是各個(gè)大廠(chǎng)抓緊采購的結果,他們急需AI平臺煉丹來(lái)追趕OpenAI等公司。等他們都采購一圈了,數據中心也建好了,英偉達的業(yè)績(jì)也就不行了吧?答: 確實(shí),目前是AI屆的軍備競賽,先買(mǎi)夠裝備再說(shuō)。從分析師給出的數據看,前兩家大廠(chǎng)采購量最大,其它家還遠遠沒(méi)到呢。目前暫時(shí)無(wú)法判斷需求已經(jīng)見(jiàn)頂,從英偉達指引看交貨還成問(wèn)題,這個(gè)軍備競賽至少還要持續一年。等到這輪軍備到位了,更新?lián)Q代也該到來(lái)了。因為目前的硬件還是存在明顯的性能問(wèn)題,我們看到煉GPT-4這種丹需要超過(guò)一年的時(shí)間。按黃老板的估計,未來(lái)十年AI算力會(huì )增加100萬(wàn)倍,這個(gè)有意思了,逼著(zhù)大廠(chǎng)們不停地更新?lián)Q代啊。這也就是黃老板說(shuō)的,英偉達自己將和自己競爭。問(wèn): 那第二層我明白了,我們看第三層。這些算力的增長(cháng)可不一定是英偉達獨吞呀,英偉達的護城河到底有多深?我看CUDA被吹到天上去了,不就是些軟件庫么,我看競爭對手都有競品了呀。AMD有ROCm,英特爾有oneAPI。答: 你有沒(méi)有發(fā)現,你在網(wǎng)上很難找到真正對比評測的內容。為什么呢?因為他們和英偉達的差距比你的認知大得多的多。問(wèn): 我看到英特爾CEO Pat Gelsinger說(shuō):“我們認為CUDA護城河又淺又小?!惫柘扇薐im Keller說(shuō),“CUDA就是沼澤地,不是護城河?!边@些大咖明顯看不上CUDA的嘛。答: 我得承認,你看到這些評論后,一定會(huì )產(chǎn)生CUDA沒(méi)什么了不起的感覺(jué)。但事實(shí)上,他們正是用含糊的語(yǔ)氣故意讓你產(chǎn)生這種錯覺(jué)。Gelsinger其實(shí)加了點(diǎn)解釋?zhuān)J為CUDA只是訓練有用,推理時(shí)就可以不用了,推理可以用英特爾AI處理器。Jim Keller說(shuō)的沼澤地什么意思他沒(méi)認真解釋?zhuān)J為X86也是沼澤地。事實(shí)上,正是積累了超過(guò)十年的沼澤地,讓競爭對手根本沒(méi)辦法抄。你知道怎么鋪柏油路,但你不知道怎么搭建一片一模一樣的沼澤地。就像微軟的Office,設計和代碼一團亂麻,但就是一種能前后兼容的沼澤地。問(wèn): 你說(shuō)的還是不夠清楚,像AMD這樣已經(jīng)有強大GPGPU的廠(chǎng)商,不需要抄CUDA,自己重新搞一套標準庫不就好了,像新鋪一個(gè)柏油路。答: 這就說(shuō)到什么是英偉達的軟硬一體了。事實(shí)上,15年前廠(chǎng)商們就在一起搞了一個(gè)叫OpenCL的計算框架,但因為市場(chǎng)太小各家又同床異夢(mèng),有bug又長(cháng)期不解決,導致它現在半死不活。AMD搞CUDA的競爭平臺ROCm也不是一天兩天了,是七年多了,但是同樣投入資源不夠,各種問(wèn)題拖到用戶(hù)崩潰,導致用戶(hù)基本都流失了。而英偉達,黃老板自稱(chēng)是個(gè)軟件公司,軟件工程師比硬件工程師多。問(wèn): 那也就是CUDA沒(méi)有像樣的競爭對手了? 英特爾正是看到OpenCL和ROCm都深陷泥潭,決定抽身出來(lái)新鋪一個(gè)路,這就是oneAPI??陀^(guān)地說(shuō),oneAPI確實(shí)志向高遠,它試圖囊括所有家的GPU,CPU,FPGA等做個(gè)高級抽象平臺。問(wèn): 沒(méi)聽(tīng)太明白。人家AMD一種硬件都搞不定,你搞各種硬件反而能搞定?答: 類(lèi)比一下吧,英特爾搞的這個(gè)東西,有點(diǎn)像谷歌搞的安卓用Java,在各種廠(chǎng)商的不同硬件上都能跑;而CUDA像iOS只能在英偉達GPU上跑,但性能最優(yōu)。英特爾收購了一家叫Codeplay的挺厲害的公司,目標是通過(guò)SYCL語(yǔ)言實(shí)現跨平臺和各種可移植的庫。但其挑戰是,SYCL遠不像當年Java那么流行而且有極其豐富的程序員資源。問(wèn): 明白了,那CUDA算是遇到挑戰者了?答: 還遠遠沒(méi)有。高性能計算需要完善的硬件層、驅動(dòng)、集群、底層庫和上層應用(PyTorch,編譯器等)的深度綁定,CUDA沒(méi)有一個(gè)短板。而其競爭對手除了最基本的GPU芯片性能類(lèi)似,別的部分都遙遙落后,單一個(gè)驅動(dòng)程序都bug百出。AMD的MI300雖然單機性能強,但并沒(méi)有那么大的實(shí)戰意義。這就是黃老板說(shuō)的,他們的硬件白送,搞出LLM的成本都比英偉達高,因為各種錯誤時(shí)間耗不起。問(wèn): 你說(shuō)的集群是什么意思?答: 煉丹超大型LLM,需要千顆以上的GPU協(xié)同工作,這種量級針對LLM的集群軟硬件生態(tài),目前只有英偉達獨此一家。即使說(shuō)到幾顆GPU的小集合,英偉達都是遙遙領(lǐng)先,這就是我們看到的Hopper架構,GPU之間連接的NVLink和NVSwitch是英偉達私有技術(shù),AMD用的PCIe并不能與之抗衡。H200首家采用的HBM3e,有恐怖的4.8TB/s帶寬來(lái)有效突破內存墻。再過(guò)兩天英偉達開(kāi)GTC,不知道還會(huì )有什么東西拿出來(lái)嚇人。問(wèn): 你真是英偉達吹啊。難道它就沒(méi)什么弱點(diǎn)可以擊破嗎?答: 在美國的H1B工簽抽簽環(huán)境下,程序員是非常稀缺的資源。加上美國互聯(lián)網(wǎng)業(yè)發(fā)達和基礎教育薄弱,其程序員的缺口巨大。驅動(dòng)程序和計算庫這種低性?xún)r(jià)比的東西,美國程序員大多是不愛(ài)做的。 和美國形成鮮明對照的是中國,基礎教育卷到發(fā)指,程序員資源如滔滔江水。我們看到,由于中美高技術(shù)脫鉤,中國必然全力發(fā)展自己的新質(zhì)生產(chǎn)力。那些AMD和英特爾正在苦苦掙扎的庫都是開(kāi)源的,我們只要投入足夠、力出一孔,必然可以大幅度縮短和英偉達CUDA的差距。
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。