阿里苦心研發(fā)NPU AI芯片究竟哪款PU更厲害?
NPU:運行效率提升 不支持大樣本訓練
本文引用地址:http://dyxdggzs.com/article/201804/378934.htmNPU是神經(jīng)網(wǎng)絡(luò )處理器,在電路層模擬人類(lèi)神經(jīng)元和突觸,并且用深度學(xué)習指令集直接處理大規模的神經(jīng)元和突觸,一條指令完成一組神經(jīng)元的處理。相比于CPU和GPU的馮諾伊曼結構,NPU通過(guò)突觸權重實(shí)現存儲和計算一體化,從而提高運行效率。但NPU也有自身的缺陷,比如不支持對大量樣本的訓練。

BPU:比在CPU上用軟件實(shí)現更為高效 不可再編程
BPU是由地平線(xiàn)主導的嵌入式處理器架構。第一代是高斯架構,第二代是伯努利架構,第三代是貝葉斯架構。BPU主要是用來(lái)支撐深度神經(jīng)網(wǎng)絡(luò ),比在CPU上用軟件實(shí)現更為高效。然而,BPU一旦生產(chǎn),不可再編程,且必須在CPU控制下使用。

從CPU、GPU的市場(chǎng)來(lái)看,已經(jīng)基本被英特爾、英偉達和AMD三分天下。而在A(yíng)SIC框架下的TPU,只有谷歌的體量和實(shí)力才有開(kāi)發(fā)專(zhuān)用加速的動(dòng)力。
推出DPU的深鑒科技有清華和斯坦福雙重學(xué)術(shù)背景,公司目前的兩條發(fā)展路線(xiàn)是:以芯片技術(shù)為主的純技術(shù)路線(xiàn),以及基于技術(shù)的產(chǎn)品路線(xiàn)。其處理器做深度學(xué)習應用端,不做訓練端。目前,其深度壓縮技術(shù)可以將神經(jīng)網(wǎng)絡(luò )壓縮數十倍而不影響精度,還可以使用芯片存儲深度學(xué)習算法模型,減少內存讀取次數,降低運行功耗。
去年10月,深鑒科技推出了六款AI產(chǎn)品,分別是人臉檢測識別模組、人臉?lè )治鼋鉀Q方案、視頻結構化解決方案、ARISTOTLE架構平臺,深度學(xué)習SDK DNNDK,以及雙目深度視覺(jué)套件。
寒武紀最初是中科院從2008年開(kāi)始的一研究項目,負責人為陳氏兄弟陳云霽和陳天石,也是寒武紀科技的創(chuàng )始人,與他們合作研究Diannao系列的Olivier Temam是Google TPU的主架構師。2016年11月,寒武紀科技正式成立,同時(shí)推出世界首款商用深度學(xué)習專(zhuān)用處理器 Cambricon-AI,是一款神經(jīng)網(wǎng)絡(luò )處理器,面向手機、無(wú)人機等類(lèi)手機的終端設備。
去年,一時(shí)火爆的華為麒麟970一大賣(mài)點(diǎn)就是集成了獨立NPU,被宣傳為世界首款手機AI芯片。確實(shí)屬實(shí)。但據了解,這塊NPU也并非華為的研究成果,而是來(lái)自寒武紀。對于華為來(lái)說(shuō),之所以如此重視NPU,或許和阿里爆出新聞的心態(tài)一樣,認為集成NPU代表了人工智能未來(lái)的發(fā)展趨勢。
去年底,地平線(xiàn)在創(chuàng )辦兩年后終于發(fā)布首款芯片——“征程”與“旭日”。目前,這兩款處理器都屬于嵌入式人工智能視覺(jué)芯片,分別面向智能駕駛和智能攝像頭。2018年CES上,英特爾和地平線(xiàn)還發(fā)布了基于伯努利架構的新一代征程處理器,其發(fā)展路徑圖為:2018年,感知;2019年,建模;2020年,決策。
而因為與英特爾的合作,地平線(xiàn)不禁讓市場(chǎng)聯(lián)想到英特爾早前重金收購的Mobileye。在嵌入式人工智能領(lǐng)域,Mobileye是業(yè)界領(lǐng)頭羊。地平線(xiàn)在英特爾的定位版圖是否是中國版Mobileye?但其創(chuàng )始人余凱的抱負是,地平線(xiàn)是要做中國的英特爾。
最后,談到人工智能芯片,還是不得不提BAT。在國際四大科技巨頭都造芯片,且ARM、英特爾、英偉達等傳統芯片廠(chǎng)商仍然統治芯片天下的情況下,中國芯能不能發(fā)展起來(lái),還需要看國內科技巨頭們的表現。相較而言,阿里在三家中最為熱衷芯片布局,上述包括寒武紀、深鑒科技均有阿里參投。
評論