AI芯片大戰格局解讀:這場(chǎng)三國殺有點(diǎn)熱鬧
谷歌的無(wú)人車(chē)在美國開(kāi)了幾十萬(wàn)公里,通過(guò)訓練練出一個(gè)自動(dòng)駕駛的AI模型。這個(gè)模型訓練出來(lái)之后,未來(lái)可以部署到每一臺量產(chǎn)的谷歌無(wú)人車(chē),實(shí)現自動(dòng)駕駛。在自動(dòng)駕駛中,這個(gè)AI模型就必須實(shí)時(shí)進(jìn)行推斷。
本文引用地址:http://dyxdggzs.com/article/201705/359223.htm英偉達Q1的財報發(fā)布后幾小時(shí),股價(jià)就暴漲14%。
老黃的Keynote還沒(méi)講完,英偉達市值就被推高20%,突破700億美元。
華爾街瘋狂的背后,是人工智能的大潮,與推動(dòng)這一大潮的全新技術(shù)。
英偉達最新的GPU芯片——TeslaV100及其TensorCore,必將讓這科技的大潮又起一層浪。
今天,我們特意邀請到兩位芯片領(lǐng)域的專(zhuān)家,專(zhuān)門(mén)來(lái)聊聊英偉達的新技術(shù),以及這場(chǎng)AI芯片大戰的關(guān)鍵看點(diǎn)。
英偉達領(lǐng)先多少
昨天以前,英偉達在深度學(xué)習芯片領(lǐng)域已經(jīng)非常領(lǐng)先了,但是還不是遙不可及。
但在一口氣發(fā)布的7個(gè)產(chǎn)品和計劃后,特別是其中的TeslaV100,確實(shí)震撼??梢哉f(shuō),大大拉開(kāi)了它與競爭對手的距離。
這不由得讓人想起90年代,思科成為互聯(lián)網(wǎng)第一波紅利的最大獲益者?,F在A(yíng)I時(shí)代的到來(lái),盡管我們還不知道它這一輪到底能沖多高,但大家都還在摩拳擦掌、買(mǎi)槍買(mǎi)炮。
而英偉達卻第一時(shí)間成為一家獨大的軍火商,肯定是AI第一波紅利的最大獲益者。
英偉達在GTC大會(huì )推出的全新GPU,確實(shí)在技術(shù)上劃了時(shí)代,吊打所有對手。
通用的GPU單元,專(zhuān)門(mén)的Tensor加速器,矩陣運算絕對性能爆炸,同時(shí)還兼顧其他算法。不愧是英偉達憑借多年在深度學(xué)習領(lǐng)域的積累、對需求深刻洞察之后推出的心血大作,比上一代強大十倍的性能,既適合訓練又適合部署。
就此,老黃已直接對絕大多數做深度學(xué)習芯片的創(chuàng )業(yè)項目宣判了死刑。
為什么GPU就適合AI?
我們來(lái)科普一下。深度學(xué)習是機器學(xué)習的一種技術(shù),基于深度神經(jīng)網(wǎng)絡(luò ),這一輪AI主要就是深度學(xué)習技術(shù)突破引領(lǐng)的。
而深度學(xué)習里面絕大多數的運算都是矩陣運算,矩陣運算天生就容易并行,而GPU最擅長(cháng)的就是做并行數學(xué)計算,所以特別適合做深度學(xué)習。
2012年的時(shí)候,Geoffrey Hinton的學(xué)生Alex Krizhevsky用GPU來(lái)做深度學(xué)習,并且取得了ImageNet大賽冠軍。經(jīng)過(guò)他們的評測,用GPU比CPU快60倍。
人工智能研究者一找上GPU,英偉達立馬抓住機會(huì ),短時(shí)間內動(dòng)用數千工程師、投入20億美元,研發(fā)出第一臺專(zhuān)門(mén)為深度學(xué)習優(yōu)化的Pascal GPU。所以,在深度學(xué)習大行其道的今天,英偉達就成了大贏(yíng)家了。而深度學(xué)習中GPU的應用,有這兩個(gè)場(chǎng)景:一個(gè)是訓練,一個(gè)是部署。所謂訓練,就是AI的構建過(guò)程,研究員在線(xiàn)下通過(guò)喂給AI算法大量的數據,產(chǎn)生出一個(gè)模型。而部署,就是把訓練好的這個(gè)模型拿到應用現場(chǎng)去用,去做推斷。
比如說(shuō),谷歌的無(wú)人車(chē)在美國開(kāi)了幾十萬(wàn)公里,通過(guò)訓練練出一個(gè)自動(dòng)駕駛的AI模型。這個(gè)模型訓練出來(lái)之后,未來(lái)可以部署到每一臺量產(chǎn)的谷歌無(wú)人車(chē),實(shí)現自動(dòng)駕駛。在自動(dòng)駕駛中,這個(gè)AI模型就必須實(shí)時(shí)進(jìn)行推斷。
訓練階段,我們主要關(guān)心的是大規模的計算吞吐率,而到了部署中,更強調的是絕對的計算能力、低延遲、高性能功耗比、高穩定性。
現在在A(yíng)I界,訓練模型普遍采用英偉達的GPU,但是到了部署領(lǐng)域呢,有人用GPU,有人用谷歌的TPU,有人用英特爾,還有一大批嵌入式芯片開(kāi)發(fā)商正在開(kāi)發(fā)專(zhuān)用的前端深度學(xué)習芯片。
但是,剛剛發(fā)布的V100,既適合做訓練,又適合做推斷,除了功耗較大以外,在能力方面實(shí)現了左右通殺,所以確實(shí)厲害。
另外,英偉達還有一個(gè)專(zhuān)門(mén)用來(lái)部署的運行時(shí)環(huán)境叫TeslaRT。所以英偉達在A(yíng)I芯片領(lǐng)域真有點(diǎn)一騎絕塵的架勢了。
難道無(wú)人能擋英偉達?
AI芯片這么大的一塊蛋糕,總得多有幾個(gè)人來(lái)分才熱鬧,就算英偉達現在的優(yōu)勢不容置疑,那接下來(lái)的疑問(wèn)就是,它的優(yōu)勢究竟能持續多久?
谷歌TPU
幾天前,在谷歌TPU團隊出走半數后,計算機體系架構的宗師DavidPatterson宣布他要加入谷歌,正式參與TPU項目。
上個(gè)月,谷歌關(guān)于TPU性能的論文披露說(shuō),TPU運行速度是英偉達和英特爾相關(guān)處理器的15-30倍,能效高出30-80倍。
谷歌的TPU適用于部署,能跟谷歌自家的TensorFlow緊密結合??上情]源的,谷歌視它為核心競爭力,應該不會(huì )開(kāi)放給別人用。
TPU的第一版很驚艷,不過(guò)缺點(diǎn)也很多?,F在從谷歌的論文來(lái)看,這個(gè)架構有點(diǎn)過(guò)時(shí),實(shí)踐當中也會(huì )有很大局限性。雖說(shuō)這次DavidPatterson加入谷歌TPU團隊的動(dòng)靜很大,但我們還是應當保持冷靜、繼續觀(guān)察。
英特爾
另一個(gè)能跟英偉達叫板的,就是老牌芯片巨頭英特爾,但它的CPU擅長(cháng)高速處理數字,卻不擅長(cháng)處理音視頻等非結構化數據。
于是在去年,英特爾耗資4億美元收購深度學(xué)習初創(chuàng )企業(yè)Nervana,試圖通過(guò)Nervana Systems在硅層實(shí)現機器學(xué)習。今年3月,這家土豪又怒砸153億美元收購一家以色列芯片公司Mobileye,土豪要用自己家的高性能計算和網(wǎng)絡(luò )連接能力,結合Mobileye的計算機視覺(jué)專(zhuān)業(yè)技術(shù),打造從云端直達每輛汽車(chē)的無(wú)人駕駛解決方案,深化它在自動(dòng)駕駛領(lǐng)域的布局。
收購Nervana,是英特爾非常厲害的一招。因為,這家公司前幾年一直在幫英偉達優(yōu)化GPU平臺。他們是一群頂級黑客團隊,hack了GPU的native指令集,寫(xiě)出了比當時(shí)的cudnn(NVIDIA自己的深度學(xué)習數學(xué)庫)還要快若干倍的數學(xué)庫。他們的成果都開(kāi)源給了社區,cudnn后面的進(jìn)步很大程度是因為吸收了這些成果。這家公司被英特爾收購后,就斷了繼續為英偉達提供服務(wù)的可能,同時(shí)也極大增強了英特爾的實(shí)力。
英特爾現在是allinAI,它的幾大產(chǎn)品線(xiàn),都會(huì )重點(diǎn)針對深度學(xué)習進(jìn)行專(zhuān)門(mén)定制,比如之前作為HPC平臺的XeonPhi加速計算卡,收購的AlteraFPGA,包括NervanaSystem,都是各自獨立的深度學(xué)習產(chǎn)品線(xiàn)。其他還包括IoT部門(mén),還有收購的Movidius公司,這些是提供嵌入式和端的解決方案。
這樣來(lái)看,在深度學(xué)習芯片上,英偉達一馬當先,英特爾黃雀在后,而谷歌的TPU,還真是任重而道遠啊。
評論