英偉達是如何煉成的?
今天,當你走進(jìn)顯卡市場(chǎng),映入眼簾的各類(lèi)產(chǎn)品大多屬于同一家公司——英偉達(Nvidia)。砥礪多年,如今的英偉達赫然在芯片界擁有著(zhù)無(wú)可撼動(dòng)的巨頭地位?;仡櫽ミ_披荊斬棘的逆襲之路,讓我們回到那個(gè)群雄林立、硝煙四起的精彩年代:
1993年,30歲的黃仁勛與兩位合伙人一起創(chuàng )辦了Nvidia,作為自己的而立之禮。
1995年,Nvidia的第一款芯片NV1四處碰壁,公司只剩下30天的周轉資金。
1998年,Nvidia推出RIVA TNT,與當時(shí)如日中天的3dfx的Voodoo卡分庭抗禮。
1999年,第一顆GPU——GeForce 256誕生,成為Nvidia在顯卡史上留下的濃墨重彩的一筆。
2000年,Nvidia收購了曾經(jīng)的對手3dfx,憑借著(zhù)GeForce系列加冕為“顯卡之王”;另一邊,ATI不甘示弱地推出了Radeon DDR,AN對峙拉開(kāi)序幕。
2006年,經(jīng)過(guò)與ATI長(cháng)達6年的拉鋸戰,Nvidia獲勝,并發(fā)布CUDA架構,邁向了新的革命進(jìn)程。
十幾年的時(shí)間說(shuō)長(cháng)不長(cháng),但放在芯片行業(yè)已足夠使滄海變桑田,物轉又星移。在一輪輪硝煙彌漫的商業(yè)戰中,對手換了一個(gè)又一個(gè),英偉達卻始終屹立不倒,不斷書(shū)寫(xiě)著(zhù)傳奇。
那么,英偉達是如何在群雄爭霸、變幻莫測的市場(chǎng)中審時(shí)度勢,百煉成鋼的呢?本文將分五個(gè)部分加以分析:
1. 前情概要:從VGA到GPU
2. 首次亮相,出師不利
3. 背水一戰,后來(lái)居上
4. 定義GPU,對峙ATI
5. 一統天下,發(fā)布革命性CUDA架構
01
前情概要:從VGA到GPU
說(shuō)到顯卡,就不得不提它的由來(lái)——VGA Card。最初的顯卡稱(chēng)為顯示適配器,是不受關(guān)注的電腦主板上的小芯片。隨著(zhù)人們對PC圖形界面的需求越來(lái)越高,顯示適配器的彩色顯示能力大大增強,VGA card也從主板上獨立出來(lái),顯卡這才誕生,但名稱(chēng)并未固定下來(lái):
VGA Card的第一代產(chǎn)品,是由ATI發(fā)布的 ATI VGA Wonder(圖像顯示卡),它只有輸出圖像功能。
到了第二代,Graphics Card(圖形加速卡)已經(jīng)具備了圖形處理能力,將CPU從大量圖形計算工作中部分解放了出來(lái),微軟Windows界面運行更加流暢。
到了第三代,Video Card(視頻加速卡)具備了視頻輔助解碼功能,此時(shí)仍是ATI主導發(fā)布。
經(jīng)過(guò)了單色、彩色、2D、視頻,到了3D時(shí)代,顯卡市場(chǎng)迎來(lái)了新局面。1996年,3dfx旗下的Voodoo系列異軍突起。第四代3D加速卡革新了所有PC圖形處理器,也開(kāi)啟了顯卡史上的“戰國時(shí)代”。
激烈的市場(chǎng)競爭加快了技術(shù)的更迭,1999年,英偉達發(fā)布了第五代顯卡~GPU(圖形處理器),硬件T&L賦予了GPU更多的圖形計算能力,顯卡由此上升到了與CPU比肩的高度。
從輸出圖形的微小芯片,到足以與CPU相提并論的圖形處理器,顯卡一步步從邊緣走向舞臺中心,而英偉達也是這樣逐步登上圖形市場(chǎng)之巔的。
02
首次亮相,出師不利
英偉達的故事,要從1993年說(shuō)起。
那年,剛從斯坦福畢業(yè)兩年的黃仁勛懷揣著(zhù)雄心壯志,與Curtis Priem和Chris Malachowsky兩位合伙人創(chuàng )辦了Nvidia。英偉達的初衷是瞄準3D領(lǐng)域,研發(fā)用于加快游戲中3D圖像渲染速度的專(zhuān)用芯片,以帶來(lái)更逼真的顯示效果。
當時(shí)的顯卡市場(chǎng)情況并不樂(lè )觀(guān),3D技術(shù)蓄勢待發(fā),2D統治力仍然在線(xiàn)。
市面上已有20多家圖形芯片公司,后起之秀層出不窮,市場(chǎng)趨于飽和。同時(shí)段ATI已發(fā)展多年,S3又憑借著(zhù)出色的2D畫(huà)質(zhì),擊敗了對家Trident,盛極一時(shí)。英偉達所面臨的對手不可謂不強大。
但彼時(shí)的英偉達初出茅廬,工程師們一腔熱血,潛心打磨了兩年,終于推出了第一款面向游戲主機的圖形卡芯片NV1。然而,這樣一款被寄予厚望的匠心之作,卻差點(diǎn)將英偉達扼殺在搖籃里。
英偉達為什么出師不利?其根本原因還是顯卡與API的適配性出了問(wèn)題。
電腦由不同硬件組成,由軟件發(fā)布指令驅動(dòng)硬件完成相應工作。顯卡作為重要的硬件,其設計必然要能夠執行軟件的指令,而連接顯卡與軟件的重要環(huán)節就是圖形API。
圖形API是一個(gè)大量底層圖形指令的集合,軟件只需將自己所要進(jìn)行的工作表達成特定的函數,進(jìn)而根據API中規定好的指令功能設定出函數的執行和指令的調用方式,便可以調用硬件來(lái)執行這些函數,完成圖形的表達工作。而被調用的硬件,即顯卡,其設計則需要遵循API的需求。因此,顯卡的實(shí)際性能表現是由其與API的契合度決定的。
英偉達在NV1的設計上,集成了最大最全的游戲方案,迥異于市面上的所有其他芯片產(chǎn)品。NV1不僅同時(shí)支持2D、3D處理能力,還擁有當時(shí)流行的音頻處理能力,按理來(lái)說(shuō)性能應該很能打。
然而,英偉達選擇了方形繪圖來(lái)實(shí)現游戲的的3D效果,它能讓NV1用更少的計算量來(lái)顯示更光滑的3D物體。
事不湊巧,在NV1發(fā)布的同一年,微軟開(kāi)發(fā)出了采用多邊形成像技術(shù)的圖形編程接口——Direct3D標準,加上此前SGL發(fā)布的OpenGL,兩者都是采取三角形繪圖渲染。
NV1采取的非主流設計,使它既不支持 OpenGL標準,也不支持后來(lái)的 direct X 標準。與主流的API標準相悖,意味著(zhù)NV1完全無(wú)法兼容行業(yè)通用標準。
此外,NV1身兼眾多功能,這也使開(kāi)發(fā)成本居高不下,產(chǎn)品最終的售價(jià)高達399美元,是同期其他同類(lèi)產(chǎn)品價(jià)格的兩倍。價(jià)格過(guò)高和需求不匹的雙重壓力下,NV1競爭優(yōu)勢并不突出,銷(xiāo)量冷淡。
產(chǎn)品剛面世就跌了個(gè)大跟頭,英偉達舉步維艱,運營(yíng)資金一度只能維持公司運轉30天。
縱使NV1讓英偉達開(kāi)局不利,但它讓游戲屆大佬世嘉看到了英偉達的技術(shù)潛力。關(guān)鍵時(shí)刻,世嘉將瀕危的英偉達拉上了岸。
游戲機與PC不同,有自己的API,而且英偉達集成 2D 和聲卡的做法也很適合游戲機。世嘉要求調整 NV1 的架構,并用在土星游戲機上,隨后成為了NV1芯片的最大客戶(hù)。NV1有了用武之地,終于可以大展身手。
有了第一次合作之后,世嘉又找到了英偉達,希望他們來(lái)做下一代主機dream cast的顯示芯片,但英偉達沒(méi)有抓住這個(gè)機會(huì )。在幫助世嘉開(kāi)發(fā)NV2的時(shí)候,英偉達堅持基于方形繪圖的設計理念與世嘉產(chǎn)生分歧,雙方的合作就此中止。
與世嘉合作破裂,研發(fā)中的 NV2 芯片也因此流產(chǎn),但世嘉提供的700萬(wàn)美元開(kāi)發(fā)資助并未收回,這也成為了英偉達的救命稻草??恐?zhù)這700萬(wàn)美金,英偉達終于摸到了市場(chǎng)的脈象。
03
背水一戰,后來(lái)居上
頭兩次的失敗給初生的牛犢狠狠澆了兩盆水。英偉達終于意識到,自己首先是一家公司,其次才是一家技術(shù)公司。閉門(mén)造車(chē)能夠成功的前提是出門(mén)合轍,衡量硬件開(kāi)發(fā)成功的標尺握在軟件的手里。
1997年,英偉達推出全球首款128位3D處理器riva128。riva128使用了三角形繪圖,加入了 OpenGL 和 Direct X 等主流 API 的支持。它也是當時(shí)最早的支持AGP1x規范的顯示芯片之一。此外,riva128采用了當時(shí)最新的NV3核心,頻率能達到100MHz,制造工藝350nm,晶體管數量300萬(wàn)。
憑借低廉的價(jià)格與高性能的2D/3D加速,riva128迅速獲得設備制造商(OEM)的認可。1997年底,Dell、Gateway和Micron相繼使用了riva 128。零售市場(chǎng)上,Diamond、STB、ASUS、ELSA和Canopus等也都相繼推出了基于riva128的產(chǎn)品。
riva128在前四個(gè)月內出貨量突破100萬(wàn)臺,這一成功為英偉達積聚了足夠的資金發(fā)展后續產(chǎn)品,也讓英偉達得以進(jìn)一步挑戰當時(shí)的市場(chǎng)霸主——3dfx。
1996年,3dfx公司推出Voodoo圖形芯片組。Voodoo是一款為游戲玩家量身定制的產(chǎn)品,專(zhuān)注于3D加速卡, 并支持D3D和OpenGL。Voodoo是一塊3D子卡,需要配合2D顯卡才能工作,但它可以跑出非常驚艷的 3D 畫(huà)面。
而英偉達的riva 128,顯示核心最大僅僅支持4MB顯存,3D分辨率只有800x600,在總體性能上與Voodoo仍有一定差距。
當時(shí)的顯卡市場(chǎng),可謂是3dfx一枝獨秀。在Voodoo統治市場(chǎng)的鼎盛時(shí)期,3dfx占據了3D加速器市場(chǎng)80-85%的份額。
為什么Voodoo會(huì )如此受市場(chǎng)追捧呢?原因離不開(kāi)它獨有的 API——Glide。
Glide是專(zhuān)為Voodoo卡打造的底層API,使得Voodoo無(wú)須硬件廠(chǎng)商額外提供API就可以直接開(kāi)發(fā)游戲。在當時(shí),Glide被公認為最好的3D接口程序,具有超高的易用性和穩定性。
由于Glide免費授權,90年代后期的絕大部分頂級游戲都支持Glide,比如極品飛車(chē)、雷神之錘系列等。當時(shí)的 PC 游戲也掀起一股 “Glide” 熱潮,即使價(jià)格遠高于同時(shí)期的riva128,不少人依然愿意花高價(jià)選擇Voodoo。
1997 年 11 月,3dfx推出Voodoo2。Voodoo2性能暴增,它的像素單元從一組升級到了兩組,頻率從 50 兆提高到了 90 兆。
此外,Voodoo2 還有一個(gè)殺手锏——SLI。憑借SLI,機器可以插入兩張Voodoo2,獲得成倍的性能提升。在那個(gè)平均工資都只有 600 塊的時(shí)代,一張Voodoo2的價(jià)格就一度高達 3000元。加上初代Voodoo的成功,不斷有游戲廠(chǎng)商尋求合作,最終Voodoo2成為了 3 dfx 最成功的一款產(chǎn)品。
面對強勢的3dfx,英偉達緊追不舍。
1998 年,英偉達推出TNT,與 Voodoo2競爭市場(chǎng)。相比 riva 128,TNT像素渲染管線(xiàn)增加到了兩根,與此同時(shí),TNT也加入了 32 位色深的支持,相比同期只支持 16 位的Voodoo2,性能大幅提升,成為當時(shí)速度最快的3D加速卡。
但由于0.25微米制程在當時(shí)沒(méi)有完善,英偉達只好采用0.35微米制程,TNT也只能在90MHz下工作,實(shí)際上,TNT 性能未能趕超Voodoo2,而是互有勝負。
好在,英偉達的渠道廣,贏(yíng)得了各大 OEM 廠(chǎng)商、板卡廠(chǎng)商的信任。在各大廠(chǎng)商的幫忙之下,英偉達扭虧為盈,站上了與3dfx爭霸的擂臺。
那么英偉達又是如何擊敗當時(shí)的巨頭3dfx呢?
在科技的比拼中,實(shí)力永遠是制勝的第一位。而在瞬息萬(wàn)變的芯片行業(yè),創(chuàng )新與質(zhì)量便是實(shí)力的代名詞。
隨著(zhù)微軟Direct X的更新完善,3dfx引以為傲的獨家API Glide在功能和效率上卻仍在原地踏步,因此逐漸失去了游戲開(kāi)發(fā)商的青睞。到了1999年,大量游戲開(kāi)始轉投Direct X和OpenGL。直到2000年12月,3dfx才宣布其Glide專(zhuān)有圖形API以開(kāi)源形式提供。
除了在圖形API方面固步自封,3dfx的第二個(gè)問(wèn)題出在代工廠(chǎng)。
為了在激烈戰局中維持利潤,3dfx于1998年收購了一線(xiàn)板卡廠(chǎng)商STB。但該公司使用的代工廠(chǎng),與臺積電以及聯(lián)華電子相比,質(zhì)量和生產(chǎn)成本都完全沒(méi)有競爭力。
此外,在團結產(chǎn)業(yè)鏈方面,3dfx也犯了大錯。由于收購S(chǎng)TB,3dfx放棄了其他板卡廠(chǎng)商并收回芯片授權,自己生產(chǎn)顯卡。這一舉動(dòng)激怒了技嘉,帝盟等一眾板卡制造商,它們紛紛轉投英偉達的懷抱。
無(wú)獨有偶,在此前的1997年,3dfx就因上市需要公開(kāi)資料,將世嘉DC的詳細參數公布于眾,導致違約,兩家對簿公堂,最終世嘉終止與3dfx的合作。
昏招迭出之下,3dfx后續推出的Voodoo3沒(méi)能履行其架構和功能設置的承諾。
反觀(guān)同期英偉達的riva TNT2,則采用了臺積電的250nm工藝,并提供了最初的TNT所希望的性能,全面勝過(guò)了Voodoo 3。
因而,到了1999年初,英偉達與3dfx的爭霸賽逐漸沒(méi)有了懸念,隨著(zhù)下半年英偉達向市場(chǎng)投以重磅炸彈,顯卡市場(chǎng)開(kāi)啟了“楚漢爭雄”階段。
04
定義GPU,對峙ATI
1999年10月1日,紛爭不斷的顯卡市場(chǎng)響起了一記驚雷。
英偉達發(fā)布了GeForce 256 SDR,這是一款基于臺積電220納米工藝、集成了2300萬(wàn)個(gè)晶體管的芯片,是世界上第一顆 GPU(圖形處理器)。
GeForce 256第一次在顯卡中加入了硬件T&L,即transforming&lighting(坐標轉換和光照計算),能夠進(jìn)行大量浮點(diǎn)運算,從而將原本依賴(lài)于CPU的3D計算剝離到顯卡上,釋放了大量CPU資源,在使得游戲運行更流暢的同時(shí),也大幅提高了畫(huà)面的精細度。
顯卡的地位隨著(zhù)GPU時(shí)代到來(lái)而大大提高,成為了游戲電腦中最核心的硬件。
此外,GeForce 256 也是史上第一款256位的顯卡,帶來(lái)了有史以來(lái)最大的一次性能提升。首發(fā)的SDR版本相比TNT2只過(guò)去了半年,性能卻有60%的提升,兩個(gè)月后發(fā)布的DDR版本又在SDR版的基礎上提升了30%的性能。
英偉達憑借著(zhù)GeForce 256這張卡皇領(lǐng)先的T&L引擎和翻倍的性能,打得各路對手不知所措。在臺式機版本上市一個(gè)月后,英偉達宣布了他們第一個(gè)適用于專(zhuān)業(yè)工作站的產(chǎn)品——Quadro,即基于GeForce 256的SGI VPro V3和VR3。
2000年12月25日,英偉達以 7000 萬(wàn)美元外加 100 萬(wàn)股股****,總計 1.1 億美元的價(jià)格收購了 3 dfx 的資產(chǎn)和專(zhuān)利,此時(shí)放眼市場(chǎng),能夠與英偉達一戰的只剩下了ATI。
當年,英偉達的利潤為4100萬(wàn)美元,是1998年的十倍,相比老牌巨頭ATI的1.6億美元,雖仍有一段距離,但這股增長(cháng)的勁頭不容小覷。
英偉達過(guò)關(guān)斬將,終于在世紀之交與ATI展開(kāi)了正面對決,而這場(chǎng)拉鋸戰一打就是六年。
英偉達的GeForce 256為其帶來(lái)了無(wú)限榮耀,隨后發(fā)布的繼任者GeForce 2 GTS又將上一代的性能大幅提升。在英偉達的步步緊逼下,ATI決定放手一搏,建立一條全新的游戲產(chǎn)品線(xiàn)。
2000年8月,全世界第一張Radeon顯卡上市了,它就是Radeon DDR,ATI宣稱(chēng)其為“有史以來(lái)為臺式PC設計的最強大的圖形處理器”,ATI也憑借其卓越的T&L性能和對即將推出的Direct X 8的支持而勉強追上了英偉達的步伐,暫且保住了圖形市場(chǎng)份額第一的位置。
但反攻也隨之到來(lái)。
英偉達于2001年2月27日發(fā)布了GeForce 3,給GPU帶來(lái)了一項突破性的改變——可編程頂點(diǎn)著(zhù)色器,用于更緊密地控制多邊形網(wǎng)格運動(dòng)和更流暢的動(dòng)畫(huà)序列,大大改進(jìn)了傳統的GPU工作流程。
微軟隨后推出的Direct X(dx) 8第一次引入了Shader model的概念,制定了可編程著(zhù)色器的標準,使得GeForce 3成為了超高分辨率下的視覺(jué)王者。
但由于支持Shader model的游戲當時(shí)尚未推出,GeForce 3最初的表現并不出眾,這就使ATI有了喘息之機。
ATI在2001年10月推出了新一代的旗艦顯卡,Radeon 8500,搭載了大幅改進(jìn)過(guò)的R200 GPU,并首次支持到 dx 8.1,領(lǐng)先于GeForce 3的dx 8,性能幾乎達到前一代Radeon DDR 的2.5倍。同時(shí),Radeon 8500還帶來(lái)了其他先進(jìn)技術(shù),令微軟也對ATI另眼相看。
在GF3系列的低時(shí)鐘Ti 200和超頻Ti 500型號的前后夾擊下,Radeon 8500表現依然不俗,A卡從這時(shí)打響了“驅動(dòng)戰未來(lái)”的名號。
然而,N卡的市占率并沒(méi)有受到太大影響,這要歸功于英偉達對產(chǎn)品線(xiàn)的部署。
早在256時(shí)期,英偉達就通過(guò)DDR、SDR和TNT三個(gè)系列實(shí)現了高中低端全面布局,再到GeForce 2時(shí)期的旗艦版GeForce 2 ultra、高端GeForce 2 Ti、甜品GeForce 2 Pro、中端GeForce 2 gts 和 低端的GeForce 2 MX,覆蓋了顯卡市場(chǎng)的每個(gè)死角,只有消費者想不到,沒(méi)有英偉達賣(mài)不到。
至此,英偉達控制了32%的圖形市場(chǎng),ATI為19%。
Nvidia在2002年2月發(fā)布了GeForce 4,從MX系列到高性能的Titanium系列(Ti 4400和Ti 4600),加上基于TSMC的150nm工藝,全方位滿(mǎn)足不同消費者對性能和性?xún)r(jià)比的需求。
面對GeForce 4出色的銷(xiāo)量,ATI破釜沉舟,選擇放棄R200的舊架構,用時(shí)一年打造出了R300,即Radeon 9700 Pro,這也成為A卡最高光的時(shí)刻。
Radeon 9700 Pro有許多“第一”的光環(huán):全球第一款支持DX 9和SM(Shader model)2.0,全球第一款使用AGP 8倍速接口,全球第一款配備256bit位寬的128 MB DDR顯存……這枚顯卡的核心里包含1.07億個(gè)晶體管,能夠完成DX 9的海量浮點(diǎn)運算,還支持高級渲染器語(yǔ)言HLSL,在畫(huà)面效果大幅飛躍的同時(shí)還降低了開(kāi)發(fā)難度。
與R300相比,GeForce 4的性能遭到全面碾壓,即使是高端的Ti 4600,很多游戲運行起來(lái)也落后R300一倍以上。R300標著(zhù)和Ti4600相同的定價(jià),提供的卻是翻倍的性能,自然廣受游戲廠(chǎng)商的歡迎。
面對ATI的逆風(fēng)翻盤(pán),英偉達這一次沒(méi)有給出及格的反應。
在錯過(guò)了微軟DX 9架構確立的消息后,英偉達推出的FX系列由于兼容問(wèn)題和高溫自燃事故全面崩盤(pán)。
曾經(jīng)的手下敗將3dfx在搬到英偉達之后終于實(shí)現了復仇,交出了糟糕的NV30圖形芯片——臭名昭著(zhù)的“吸塵器”FX 5800和速度較慢的FX 5800 Ultra,甚至還落后于預定期限,更別提追上ATI了。
在這一回合里,ATI始終憑借著(zhù)優(yōu)越的驅動(dòng)程序保持領(lǐng)先,市場(chǎng)的天平開(kāi)始向A卡傾斜。于是英偉達痛定思痛,迅速投入了下一代DX9.0c 顯卡的研發(fā)。
功夫不負有心人,2004年英偉達又向沉寂許久的顯卡市場(chǎng)投下了一顆重磅炸彈——GeForce 6800 Ultra(NV40),首次支持Direct X 9.0c、SM 3.0,疊加Nvidia的PureVideo解碼和播放引擎,還引入了SLI技術(shù),即允許多個(gè)GPU連接在一起,從而顯著(zhù)提升單臺機器的圖形處理能力。
另一邊,ATI僅在一個(gè)月后就拿出了R400c 應對,但只是沿用R300的架構,并不支持DX 9.0c、SM 3.0。
2005年,英偉達與ATI繼續交錯發(fā)布新產(chǎn)品,戰況激烈。ATI的年度收入達到22億美元,創(chuàng )下公司歷史最高紀錄。然而,凈利潤卻下滑至1,690萬(wàn)美元,這是受累于加速迭代產(chǎn)品和高額的研發(fā)費用。光靠ATI的力量已經(jīng)無(wú)力再與英偉達競爭。
2006年10月25日,ATI被CPU巨頭AMD收購,AMD因此背負了巨額債務(wù)。
負債累累的AMD在CPU方面應戰英特爾,在GPU方面應戰英偉達,不同的強敵使其一時(shí)難以招架,隨之帶來(lái)市場(chǎng)份額下滑與顯卡發(fā)布延期,這就給英偉達創(chuàng )造了寬松的發(fā)展空間,使其進(jìn)一步搶占了更多的市場(chǎng)份額。
AN爭霸戰,終于以英偉達的勝利告終。
05
一統天下,發(fā)布革命性CUDA架構
隨著(zhù)顯卡大戰走向終結,GPU的發(fā)展也迎來(lái)了一個(gè)轉折點(diǎn)。
在當時(shí),英特爾的CPU可以通過(guò)多線(xiàn)程技術(shù)被所有計算機應用分享,但GPU還只能通過(guò)OpenGL/Direct X等接口跟用戶(hù)交互。到了2005年,主要的GPU制造商都使用頂點(diǎn)著(zhù)色單元和像素渲染單元兩種計算資源。然而,合理配置這兩種資源的問(wèn)題卻始終沒(méi)有得到完美解決。特別是兩種處理器數量的最佳比例是隨應用的變化而變化的,因此經(jīng)常出現一種處理器不夠用、而另一種處理器閑置的情況,這就限制了高性能運算技術(shù)的發(fā)展。
雖然當時(shí)英偉達的傳統游戲和專(zhuān)業(yè)繪圖業(yè)務(wù)并沒(méi)有這樣的高性能運算需求,英偉達首席科學(xué)家David Kirk卻認為,從長(cháng)遠看,讓原本只做3D渲染的GPU技術(shù)通用化,有重大戰略意義。
如果能夠給GPU裝備一組完全相同的、具有較強編程能力的內核,根據任務(wù)情況在頂點(diǎn)和片元處理任務(wù)之間動(dòng)態(tài)分配,問(wèn)題就會(huì )被完美地解決了,而這套編程體系正是著(zhù)名的CUDA(Compute Unified Device Architecture)技術(shù)。
David Kirk最終說(shuō)服黃仁勛,投入大量資源研發(fā)能夠讓GPU變得通用化的CUDA技術(shù),并讓每一顆英偉達GPU都支持CUDA。這一舉動(dòng)在當時(shí)被視為不計成本的瘋狂之舉,絕對是一場(chǎng)****上全部身家的押注。
在技術(shù)方面,芯片面積增大、散熱增加、成本上升、故障率增高;同時(shí),還要保證每款產(chǎn)品的軟件驅動(dòng)都支持CUDA,這對英偉達的工程師來(lái)說(shuō)是巨大的工作量。
在資金方面,一旦項目啟動(dòng),每年砸到CUDA的研發(fā)成本估算就有5億美元,而當時(shí)公司全年的總收入約30億美元。更何況,在當時(shí)CUDA只是一個(gè)與公司核心業(yè)務(wù)關(guān)系不緊密的軟件平臺。最后來(lái)看,自CUDA推出以來(lái),英偉達在將GPU轉化為更通用的計算工具上投入了將近100億美元。
從G80開(kāi)始,英偉達GPU體系結構已經(jīng)全面支持通用編程,同時(shí)英偉達也推出了CUDA編程技術(shù),為GPU通用程序設計提供了第一套完整工具。在G80之后,英偉達又推出G90、Fermi、Kepler和Maxwell等多代GPU,其通用計算能力越來(lái)越強大。
而此時(shí),計算行業(yè)也正在發(fā)生著(zhù)變革,摩爾定律帶來(lái)的計算提升速度正在放緩,這也讓當初借此統治芯片市場(chǎng)的英特爾地位發(fā)生動(dòng)搖。諸多芯片設計公司試圖從無(wú)到有打造更專(zhuān)業(yè)的芯片,并讓該類(lèi)芯片與英特爾處理器一同運行。
英偉達不需要從頭做起,只要重新定位已有的芯片,利用在CUDA項目中開(kāi)發(fā)的芯片和軟件,就打造出一個(gè)廣受程序員和企業(yè)歡迎的技術(shù)平臺。
芯片戰爭還在繼續。
在A(yíng)I領(lǐng)域,芯片制造商之間的斗爭才剛開(kāi)始。英特爾接連重金收購了可編程芯片制造商Altera、專(zhuān)注于研究深度學(xué)習和機器視覺(jué)的其他創(chuàng )業(yè)公司、還有為汽車(chē)生產(chǎn)自動(dòng)駕駛設備的以色列公司Mobileye。谷歌也在自研人工智能芯片,在TPU的助力下,谷歌在圍棋比賽中擊敗了世界冠軍柯潔。
但無(wú)論是誰(shuí),都無(wú)法在通用計算領(lǐng)域真正與英偉達爭雄。
06
尾聲
分久必合,合久必分。經(jīng)歷了戰國混戰、楚漢爭雄,英偉達成為顯卡市場(chǎng)毋庸置疑的統治者。
但英偉達一路上的挫折實(shí)在不少,黃仁勛也不是一個(gè)全知全能的創(chuàng )業(yè)者。創(chuàng )業(yè)初期執意用方形繪圖的技術(shù)路線(xiàn),追求盡善盡美的全能產(chǎn)品定義,都是英偉達曾經(jīng)犯過(guò)的致命錯誤。但是,好在黃仁勛懸崖勒馬,在存亡危急之秋力挽狂瀾,最終成長(cháng)為一個(gè)在商業(yè)上高度理性、卻又保持積極進(jìn)取、知道犯錯就打臉改正的企業(yè)家。
而英偉達一路崛起和升級打怪的關(guān)鍵,在于敏銳把握商業(yè)環(huán)境中的關(guān)鍵變量,永遠比對手先行一步。
正是在世紀之交的顯卡大戰中,黃仁勛天才般地聚集了GPU行業(yè)成功所需的核心要素:
在圖形API上,英偉達開(kāi)放擁抱direct x和OpenGL,摒棄閉門(mén)造車(chē)的陋習;
在產(chǎn)品定義上,英偉達率先將硬件T&L等功能從CPU解放出來(lái),重新定義了GPU,并逐漸修煉出嫻熟的刀法,為不同的人群和市場(chǎng)定位出高、中、低端產(chǎn)品,最大化市場(chǎng)收益;
在技術(shù)路線(xiàn)上,英偉達廣泛吸取業(yè)界的前瞻性概念并加以激進(jìn)實(shí)現,率先支持shader model和發(fā)布CUDA,都是無(wú)與倫比的杰作;
在晶圓代工上,英偉達與臺積電結成了牢固的同盟,由此開(kāi)始了長(cháng)達二十多年的戰斗友誼,產(chǎn)業(yè)鏈上游始終穩如磐石;
在板卡和OEM廠(chǎng)商上,英偉達團結了最多的產(chǎn)業(yè)鏈下游,鞏固了市場(chǎng)渠道。
在劇烈動(dòng)蕩的芯片市場(chǎng),黃仁勛在混沌變化的環(huán)境中建立了全面穩固的支撐,英偉達的創(chuàng )新冒險也由此變得不再那么高風(fēng)險而致命,而是可以一步一步,搭建起通往通用計算的天梯,完成對計算世界的整合。
英偉達的神話(huà)至今還在延續。太平洋西岸的中國,一場(chǎng)對標英偉達的創(chuàng )業(yè)潮徐徐拉開(kāi)了帷幕。
那么,誰(shuí)能成為中國的英偉達呢?
來(lái)源:遠川科技評論
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。
功分器相關(guān)文章:功分器原理