詳解人工智能芯片 CPU/GPU/FPGA有何差異?
4.GPU行業(yè)的佼佼者:Nvidia
本文引用地址:http://dyxdggzs.com/article/201704/346122.htm目前全球GPU行業(yè)的市場(chǎng)份額有超過(guò)70%被英偉達公司占據,而應用在人工智能領(lǐng)域的可進(jìn)行通用計算的GPU市場(chǎng)則基本被英偉達公司壟斷。
2016年三季度英偉達營(yíng)收為20.04億美元,較上年同期的13.05億美元增長(cháng)54%;凈利潤為5.42億美元,較上年同期的2.46億美元增長(cháng)120%,營(yíng)收的超預期增長(cháng)推動(dòng)其盤(pán)后股價(jià)大幅上漲約16%。以面向的市場(chǎng)平臺來(lái)劃分,游戲業(yè)務(wù)營(yíng)收12.4億美元,同比增長(cháng)63%,是創(chuàng )造利潤的核心部門(mén);數據中心業(yè)務(wù)營(yíng)收2.4億美元,同比增長(cháng)193%,成為增長(cháng)最快的部門(mén);自動(dòng)駕駛業(yè)務(wù)營(yíng)收1.27億美元,同比增長(cháng)61%,正在逐步打開(kāi)市場(chǎng)。

這樣的業(yè)績(jì)創(chuàng )下了英偉達的歷史最好季度收入,但這并非是其股票暴漲的理由,事實(shí)上,在過(guò)去的六年里,英偉達的業(yè)績(jì)基本一直呈現上升趨勢。從2012年財年至2016財年,英偉達的營(yíng)業(yè)收入實(shí)現了從40億美元到50億美元的跨越,而其凈利潤也從2012財年的5.8億美元逐步上升到了2016財年的6.14億美元。但在此期間,英偉達的股價(jià)并未出現翻番式的增長(cháng)。
真正促成英偉達股價(jià)飆升的是人工智能的新市場(chǎng)。在剛剛過(guò)去的2016年,英偉達的股價(jià)上漲了228%,過(guò)去的5年內累計上漲500%。500億美元的市值將會(huì )持續給英偉達帶來(lái)40倍的市場(chǎng)收入,這幾乎是業(yè)內擁有最高收益的公司。
5.Nvidia的市場(chǎng)定位:人工智能計算公司
自1999年發(fā)布第一款GPU以來(lái),GPU就成為了英偉達最為核心的產(chǎn)品,占到了英偉達總營(yíng)業(yè)收入的八成,而英偉達也以顯卡廠(chǎng)商的身份進(jìn)入人們的視線(xiàn)。這些芯片最初是以板卡的形式出售給游戲玩家的,游戲玩家需要自己動(dòng)手將芯片裝到PC主板上,從而擁有更快的3D圖形處理速度。他們的產(chǎn)品命名也很有講究,用“GeForce”這樣具有超能力的字眼來(lái)開(kāi)辟市場(chǎng)。
今日的英偉達,已經(jīng)不再是一家單純的顯卡技術(shù)廠(chǎng)商,他現在很趕時(shí)髦地稱(chēng)自己為“人工智能計算公司”。據英偉達官網(wǎng)數據顯示,2016年,有近兩萬(wàn)家機構將英偉達產(chǎn)品用于深度學(xué)習加速計算,相比2014年翻了13倍。醫療、生命科學(xué)、教育、能源、金融、汽車(chē)、制造業(yè)以及娛樂(lè )業(yè)等諸多行業(yè)均將得益于海量數據的分析。
谷歌、微軟、Facebook 和亞馬遜等技術(shù)巨頭大量購買(mǎi)英偉達的芯片來(lái)擴充自己數據中心的處理能力;Massachusetts General Hospital等醫療研究機構用英偉達的芯片來(lái)標記CT掃描圖片上的病變點(diǎn);特斯拉將在所有的汽車(chē)上安裝英偉達的芯片來(lái)實(shí)現無(wú)人駕駛; June等家電公司用英偉達的芯片制造人工智能驅動(dòng)的家用電器。在人工智能到來(lái)之前,英偉達從來(lái)都沒(méi)有處于一個(gè)如此巨大的市場(chǎng)的中心,這也充分表明了一個(gè)事實(shí),那就是英偉達在GPU的計算處理技術(shù)上無(wú)人能及。
同時(shí),英偉達還在投資不同領(lǐng)域里新興的、需要借助深度學(xué)習來(lái)構建業(yè)務(wù)的公司,使這些公司能夠更好地借助其提供的人工智能平臺起步,這類(lèi)似于以前一些初創(chuàng )公司通過(guò)微軟Windows來(lái)構建服務(wù)以及最近通過(guò)iTunes來(lái)發(fā)布應用。

6.Nvidia的核心產(chǎn)品:Pascal家族
英偉達的傳統強項是桌面和移動(dòng)終端的GPU,但是堅定地向著(zhù)人工智能大步邁進(jìn)的英偉達顯然已經(jīng)不滿(mǎn)足于僅僅在單一領(lǐng)域做提高GPU性能的事了。相比于傳統的計算密集型GPU產(chǎn)品來(lái)說(shuō),英偉達努力的方向是使得GPU芯片不僅僅只針對訓練算法這一項起到作用,更是能處理人工智能服務(wù)的推理工作負載,從而加速整個(gè)人工智能的開(kāi)發(fā)流程。目前該公司的核心產(chǎn)品包括基于Pascal架構的TeslaP4與Tesla P40深度學(xué)習芯片,這兩款芯片均已于2016年第四季度開(kāi)始投入量產(chǎn)。
Tesla P4為資料中心帶來(lái)最高的能源效率
其小尺寸及最小50瓦特的低功率設計可安裝于任何服務(wù)器內,讓生產(chǎn)作業(yè)負載推論的能源效率達CPU的40倍。在進(jìn)行視頻推論作業(yè)負載時(shí),單一服務(wù)器裡安裝單顆Tesla P4即可取代13臺僅采用CPU的服務(wù)器,而包含服務(wù)器及用電量的總持有成本則能節省達8倍。
Tesla P40為深度學(xué)習作業(yè)負載帶來(lái)最大的處理量
一臺搭載8顆Tesla P40加速器的服務(wù)器擁有每秒47兆次運算的推論性能及INT8指令,可取代140臺以上的CPU服務(wù)器的性能。若以每臺CPU服務(wù)器約5,000美元計算,可節省65萬(wàn)美元以上的服務(wù)器采購成本。
基于上述兩種人工智能芯片,英偉達為資料中心提供唯一的端對端深度學(xué)習平臺,并能夠將訓練時(shí)間從數天大幅縮短至數小時(shí),從而實(shí)現資料的立即解析與服務(wù)的及時(shí)回應。
7.Nvidia的應用布局:自動(dòng)駕駛
不僅僅是底層架構,英偉達在應用層面上也有非常明確的布局,其中最看重也最有領(lǐng)先優(yōu)勢的就是自動(dòng)駕駛。早在2014年1月,英偉達就發(fā)布了為移動(dòng)平臺設計的第一代Tegra系列處理器,適用于智能手機、平板電腦和自動(dòng)駕駛汽車(chē),四個(gè)月后,DRIVE PX自動(dòng)駕駛計算平臺發(fā)布,可實(shí)現包括高速公路自動(dòng)駕駛與高清制圖在內的自動(dòng)巡航功能。同年10月,搭載了Tegra K1處理器并應用了DRIVEPX計算平臺的特斯拉新款Model S開(kāi)始量產(chǎn),英偉達成為第一個(gè)享受到自動(dòng)駕駛紅利的廠(chǎng)商。
2016年英偉達在自動(dòng)駕駛領(lǐng)域并沒(méi)有什么重大突破,基本只是從技術(shù)升級及廠(chǎng)商合作兩個(gè)方面入手,除了特斯拉這個(gè)老朋友外,百度、沃爾沃也跟英偉達達成了合作,他們都將生產(chǎn)搭載DRIVE PX 2的智能駕駛汽車(chē)。恰逢此時(shí),AI概念變得更加火熱,智能駕駛也逐漸成熟,這些客觀(guān)因素讓英偉達收割了更多的紅利,也讓公司站在了聚光燈之下。
從整個(gè)自動(dòng)駕駛行業(yè)來(lái)看,Google、蘋(píng)果、微軟等科技公司都在建立自己的汽車(chē)生態(tài)體系,不過(guò)智能汽車(chē)對于他們來(lái)說(shuō)都不是核心業(yè)務(wù),更為重要的是,他們并沒(méi)有真正進(jìn)入汽車(chē)供應鏈體系。與之相反,英偉達的Drive PX系列自動(dòng)駕駛解決方案,已經(jīng)進(jìn)入了汽車(chē)的上游供應鏈中,并創(chuàng )造了利潤,這也意味著(zhù)英偉達將在汽車(chē)芯片市場(chǎng)與英特爾、高通、恩智浦、瑞薩電子等做CPU的公司正面碰撞,自動(dòng)駕駛的風(fēng)口讓英偉達在汽車(chē)市場(chǎng)從“邊緣人”變成了挑戰者。
隨著(zhù)特斯拉Model S等備受矚目的車(chē)型更加智能化與多媒體化,英偉達有了彎道超車(chē)的機會(huì ),并有望在汽車(chē)產(chǎn)業(yè)的上游供應鏈占據更有優(yōu)勢的地位。最新款的Tegra系列處理器功耗只有10瓦,幾乎與同等級的FPGA產(chǎn)品功耗持平甚至更低,這對于車(chē)載移動(dòng)芯片來(lái)說(shuō)是巨大的優(yōu)勢。
但同樣的,單移動(dòng)處理器的架構和極低的功耗必然無(wú)法支撐起超大規模的運算,目前英偉達計算平臺的功能定位僅聚焦于高速公路上的自動(dòng)巡航,而CPU的應用可以拓展至車(chē)機娛樂(lè )信息系統層面。未來(lái)自動(dòng)駕駛的發(fā)展方向必然是整車(chē)的控制中心,從目前英偉達基于Tesla架構的主流芯片來(lái)看,低功耗、極速運算與邏輯控制是可以同時(shí)實(shí)現的,英偉達公司在自動(dòng)駕駛領(lǐng)域的優(yōu)勢非常明顯。
8.Nvidia的產(chǎn)業(yè)優(yōu)勢:完善的生態(tài)系統
與其它芯片公司相比,帶有CUDA的重點(diǎn)軟件生態(tài)系統是英偉達占領(lǐng)人工智能市場(chǎng)的關(guān)鍵促成因素。從2006年開(kāi)始,英偉達發(fā)布了一個(gè)名叫CUDA的編程工具包,該工具包讓開(kāi)發(fā)者可以輕松編程屏幕上的每一個(gè)像素。在CUDA發(fā)布之前,給GPU編程對程序員來(lái)說(shuō)是一件極其痛苦的事,因為這涉及到編寫(xiě)大量低層面的機器碼以實(shí)現渲染每一個(gè)不同像素的目標,而這樣的微型計算操作通常有上萬(wàn)個(gè)。CUDA在經(jīng)過(guò)了英偉達的多年開(kāi)發(fā)之后,成功將Java或C++這樣的高級語(yǔ)言開(kāi)放給了GPU編程,從而讓GPU編程變得更加輕松簡(jiǎn)單,研究者也可以更快更便宜地開(kāi)發(fā)他們的深度學(xué)習模型。
四、未來(lái)市場(chǎng):半定制芯片FPGA
技術(shù)世界正在邁向一個(gè)全新的軌道,我們對于人工智能的想象已經(jīng)不再局限于圖片識別與聲音處理,機器,將在更多領(lǐng)域完成新的探索。不同領(lǐng)域對計算的需求是差異的,這就要求深度學(xué)習的訓練愈發(fā)專(zhuān)業(yè)化與區別化。芯片的發(fā)展趨勢必將是在每一個(gè)細分領(lǐng)域都可以更加符合我們的專(zhuān)業(yè)需求,但是考慮到硬件產(chǎn)品一旦成型便不可再更改這個(gè)特點(diǎn),我們不禁開(kāi)始想,是不是可以生產(chǎn)一種芯片,讓它硬件可編程。
也就是說(shuō),這一刻我們需要一個(gè)更適合圖像處理的硬件系統,下一刻我們需要一個(gè)更適合科學(xué)計算的硬件系統,但是我們又不希望焊兩塊板子,我們希望一塊板子便可以實(shí)現針對每一個(gè)應用領(lǐng)域的不同需求。這塊板子便是半定制芯片FPGA,便是未來(lái)人工智能硬件市場(chǎng)的發(fā)展方向。
評論