TPU比CPU快80倍 秘訣在哪里?
我們生活在一個(gè)技術(shù)推動(dòng)整個(gè)文明基石的時(shí)代。但是,盡管擁有所有輝煌的發(fā)明和技術(shù)進(jìn)步,今天世界比以往更傾向于速度和敏捷性。我們已經(jīng)從傳統的有線(xiàn)撥號互聯(lián)網(wǎng)連接轉移到第四代無(wú)線(xiàn)網(wǎng)絡(luò )。光纖的廣泛分布使得連接到互聯(lián)網(wǎng)并以快速的速度訪(fǎng)問(wèn)數據成為可能。同樣,當涉及到處理器和GPU時(shí),我們已經(jīng)從僅包含6000個(gè)晶體管的傳統8位8080微處理器芯片轉變?yōu)闀r(shí)鐘速度高達1.7 GHz的最先進(jìn)的Octa核心處理器。
本文引用地址:http://dyxdggzs.com/article/201809/391585.htm人工智能的發(fā)展越來(lái)越抽象,越來(lái)越復雜。從早期簡(jiǎn)單的是與否的判斷,到后來(lái)精準的識別,可以在復雜的場(chǎng)景里找出特定的目標,再到后來(lái),出現 AlphaGo 這樣可以做出主動(dòng)的決策的 AI,甚至智能如 AlphaGo Zero,可以完全依靠自學(xué)實(shí)現快速成長(cháng)。
人工智能經(jīng)過(guò)這么長(cháng)時(shí)間的發(fā)展,在網(wǎng)絡(luò )的種類(lèi)、復雜程度和處理的信息量上都發(fā)生了天翻地覆的變化。網(wǎng)絡(luò )種類(lèi)上,從早期的 AlexNet 和 GoogleNet 到現在各種各樣的 GAN(生成對抗網(wǎng)絡(luò ))以及各種深度強化學(xué)習的網(wǎng)絡(luò ),它們各自網(wǎng)絡(luò )結構都有不同,開(kāi)發(fā)者在適應最新的網(wǎng)絡(luò )上常常會(huì )遇到一些麻煩。
處理的信息量也在成倍地增長(cháng),算力需求越來(lái)越高的情況下,對搭載處理單元的體積有更多限制的機器人實(shí)際上存在著(zhù)在智能水平上升級的障礙。這就是為什么人工智能芯片不斷升級迭代的原因。
人工智能的終極目標是模擬人腦,人腦大概有1000億個(gè)神經(jīng)元,1000萬(wàn)億個(gè)突觸,能夠處理復雜的視覺(jué)、聽(tīng)覺(jué)、嗅覺(jué)、味覺(jué)、語(yǔ)言能力、理解能力、認知能力、情感控制、人體復雜機構控制、復雜心理和生理控制,而功耗只有10~20瓦。
可能有很多人會(huì )問(wèn),目前在人工智能領(lǐng)域,NVidia GPU為什么具有無(wú)可撼動(dòng)的霸主地位,為什么AMD的GPU和NVidia GPU性能相差不多,但是在人工智能領(lǐng)域的受歡迎的程度卻有天壤之別。
2011年,負責谷歌大腦的吳恩達通過(guò)讓深度神經(jīng)網(wǎng)絡(luò )訓練圖片,一周之內學(xué)會(huì )了識別貓,他用了12片GPU代替了2000片CPU,這是世界上第一次讓機器認識貓。
2016年,谷歌旗下Deepmind團隊研發(fā)的機器人AlphaGo以4比1戰勝世界圍棋冠軍職業(yè)九段棋手李世石(AlphaGo的神經(jīng)網(wǎng)絡(luò )訓練用了50片GPU,走棋網(wǎng)絡(luò )用了174片GPU),引發(fā)了圍棋界的軒然大波,因為圍棋一直被認為是人類(lèi)智力較量的巔峰,這可以看做是人工智能史上的又一個(gè)重大里程碑事件。
谷歌并不是唯一一家為這種設備上的AI任務(wù)設計芯片的公司。 ARM,Qualcomm,Mediatek和其他公司都制造了自己的AI加速器,而Nvidia制造的GPU在培訓算法市場(chǎng)上占據了主導地位。
然而,Google的競爭對手并沒(méi)有控制整個(gè)AI堆棧。 客戶(hù)可以將他們的數據存儲在Google的云端; 使用TPU訓練他們的算法; 然后使用新的Edge TPU進(jìn)行設備上推斷。而且,他們很可能會(huì )使用TensorFlow創(chuàng )建他們的機器學(xué)習軟件--TensorFlow是由Google創(chuàng )建和運營(yíng)的編碼框架。
這種垂直整合具有明顯的好處。 Google可以確保所有這些不同的部分盡可能高效,順暢地相互通信,使客戶(hù)更容易在公司的生態(tài)系統中玩游戲。
2016年5月的谷歌I/O大會(huì ),谷歌首次公布了自主設計的TPU,2017年谷歌I/O大會(huì ),谷歌宣布正式推出第二代TPU處理器,在今年的Google I/0 2018大會(huì )上,谷歌發(fā)布了新一代TPU處理器——TPU 3.0。TPU 3.0的性能相比目前的TPU 2.0有8倍提升,可達10億億次。
TPU全名為T(mén)ensor Processing Unit,是谷歌研發(fā)的一種神經(jīng)網(wǎng)絡(luò )訓練的處理器,主要用于深度學(xué)習、AI運算。在7月份的Next 云端大會(huì ),谷歌又發(fā)布了 Edge TPU 芯片搶攻邊緣計算市場(chǎng)。雖然都是 TPU,但邊緣計算用的版本與訓練機器學(xué)習的 Cloud TPU 不同,是專(zhuān)門(mén)用來(lái)處理AI預測部分的微型芯片。Edge TPU可以自己運行計算,而不需要與多臺強大計算機相連,因此應用程序可以更快、更可靠地工作。它們可以在傳感器或網(wǎng)關(guān)設備中與標準芯片或微控制器共同處理AI工作。
評論