將門(mén)沈強:智能芯片是人工智能算力創(chuàng )新的基石
“今天是一個(gè)半導體行業(yè)的盛會(huì ),正好將人工智能的軟件要素、硬件要素交融在一起。”將門(mén)CTO、將門(mén)創(chuàng )投創(chuàng )始合伙人沈強在集微半導體峰會(huì )上從算法、算力和數據的角度談了人工智能的不同創(chuàng )新模式。
本文引用地址:http://dyxdggzs.com/article/201709/364721.htm2017年9月15日,由集微網(wǎng)、手機中國聯(lián)盟主辦,廈門(mén)半導體投資集團公司承辦的“集微半導體峰會(huì )”在廈門(mén)海滄舉行。此次峰會(huì )以“‘芯’聯(lián)產(chǎn)業(yè),積微成著(zhù) ”為主題,同期舉辦的人工智能論壇專(zhuān)場(chǎng),來(lái)自將門(mén)創(chuàng )投、碼隆科技、偉景智能、悅享趨勢科技和元鼎音訊的企業(yè)高層、人工智能產(chǎn)業(yè)界的優(yōu)秀人才等圍繞當前熱點(diǎn)話(huà)題、核心技術(shù)以及大家共同關(guān)注的市場(chǎng)動(dòng)向,重塑熱點(diǎn)話(huà)題,解析趨勢變化,洞悉行業(yè)變革。
沈強作為此次人工智能論壇的主持,開(kāi)場(chǎng)介紹將門(mén)這家專(zhuān)注于發(fā)掘、加速及投資技術(shù)驅動(dòng)型創(chuàng )業(yè)公司的創(chuàng )業(yè)服務(wù)和投資機構,其旗下還設有將門(mén)企業(yè)用戶(hù)對接、將門(mén)技術(shù)社群以及將門(mén)投資基金。
據悉,將門(mén)投資基金專(zhuān)注于投資通過(guò)技術(shù)創(chuàng )新激活商業(yè)場(chǎng)景,實(shí)現商業(yè)價(jià)值的初創(chuàng )企業(yè)。關(guān)注領(lǐng)域包括機器智能、物聯(lián)網(wǎng)、自然人機交互、企業(yè)計算。在一年時(shí)間里,將門(mén)投資基金已經(jīng)投資了包括量化派、碼隆科技、偉景智能、禾賽科技等超過(guò)10家具有高成長(cháng)潛力的技術(shù)型創(chuàng )業(yè)公司。
據沈強介紹,將門(mén)聚焦在“MINE”四個(gè)主要領(lǐng)域,其中M是機器智能,I是物聯(lián)網(wǎng)相關(guān),從物聯(lián)網(wǎng)通訊、傳感器、數據處理、物聯(lián)網(wǎng)應用。N是自然人機交互,E網(wǎng)是企業(yè)計算,包括云計算,企業(yè)應用,信息安全等。
Gartner數據顯示,未來(lái)兩年到三年的時(shí)間內,人工智能將會(huì )進(jìn)入一個(gè)泛應用的時(shí)間點(diǎn)。沈強進(jìn)一步指出,從人工智能的技術(shù)成熟度的曲線(xiàn)來(lái)看,現在這個(gè)時(shí)間點(diǎn)剛剛好。目前,人工智能主要是數據驅動(dòng)型的方式,深度學(xué)習在里面起了很關(guān)鍵的作用。然而,從創(chuàng )新角度來(lái)講,可以從人工智能的三要素,算法、算力和數據三個(gè)角度出發(fā),尋找合適的應用場(chǎng)景落地,再將其轉化成商業(yè)價(jià)值。場(chǎng)景的創(chuàng )新等于商業(yè)價(jià)值的創(chuàng )新,算力的創(chuàng )新可以理解為硬件創(chuàng )新,算法的創(chuàng )新理解為軟件創(chuàng )新,結合起來(lái)從是軟硬結合的方式共創(chuàng )人工智能的新精彩。
從創(chuàng )新場(chǎng)景來(lái)看,除了規模宏大的交通、運輸等方面,人工智能的商業(yè)價(jià)值無(wú)處不在,需要我們去深挖。沈強通過(guò)一個(gè)消費實(shí)例來(lái)告訴現場(chǎng)的嘉賓,即使一個(gè)微小的應用場(chǎng)景,當結合上人工智能的時(shí)候,便能夠激活一個(gè)創(chuàng )新的場(chǎng)景,實(shí)現商業(yè)價(jià)值。他講道,有一段時(shí)間經(jīng)常在外面出差,家里的貓無(wú)人照料,便選用了一款自動(dòng)喂貓的機器,每天定時(shí)喂養家里的貓,這是一個(gè)極其細分極其細小的市場(chǎng)。在使用過(guò)程中遇到一些問(wèn)題,便聯(lián)系到做寵物喂養、自動(dòng)喂食器公司的老總聊了一下,詢(xún)問(wèn)未來(lái)在這一領(lǐng)域想做的創(chuàng )新,發(fā)現其實(shí)跟人工智能有很大的關(guān)系。在喂食器上面添加一個(gè)攝像頭,既可以給主人做遠程監控使用,還能夠做貓臉識別,為不同年齡階段的貓、不同健康狀況的貓做個(gè)性化的喂養服務(wù)。“這對我來(lái)說(shuō)是一個(gè)教育,如此微小的市場(chǎng),通過(guò)與人工智能的結合便能夠激活一個(gè)創(chuàng )新的應用場(chǎng)景。”
從算法來(lái)看,人工智能的發(fā)展離不開(kāi)深度學(xué)習模型,而深度神經(jīng)網(wǎng)絡(luò )更是其中最重要的一部分。過(guò)去十幾年來(lái),從2012年DiagonalLineNode開(kāi)始,神經(jīng)網(wǎng)絡(luò )的結構一直在持續的發(fā)展中。2015年其實(shí)是一個(gè)關(guān)鍵節點(diǎn),微軟研究院提出的深度高達152層的神經(jīng)網(wǎng)絡(luò ),視覺(jué)計算組的系統錯誤率已經(jīng)低至3.57%,首次實(shí)現了對人類(lèi)視覺(jué)能力的突破,這意味著(zhù)在商業(yè)可行性上,它可以在某些特定場(chǎng)景下取代人發(fā)揮作用。神經(jīng)網(wǎng)絡(luò )的層數逐漸增多,由此帶來(lái)了巨大問(wèn)題,軟件方面的改進(jìn)對硬件也提出了需求。如此復雜的網(wǎng)絡(luò ),無(wú)論在服務(wù)器端還是設備端,都對其計算能力提出了更高的要求,如此才能夠讓高精度的識別能力重現。
一直以來(lái),深度學(xué)習的算法都用來(lái)處理圖像、識別聲音,集中在識別圖片中的一只貓或者一個(gè)只狗,再進(jìn)一步分類(lèi)+定位,標注出其在圖中的區域和位置。隨著(zhù)深度學(xué)習算法與自然語(yǔ)言的 結合處理,可以用于對象的檢測,把多只貓、多只狗、多個(gè)人分開(kāi),進(jìn)一步做實(shí)際分割,逐步應用在安防、機器人應用。沈強表示,其實(shí)在固體識別的檢測方面,過(guò)去用R-CNN算法可以達到53.3%,而現在用FasterR-CNN可以達到83.8%。從圖像分割延伸至視頻處理,目前越來(lái)越多的深度學(xué)習算法可以很好的做視頻分割操作,以識別出視頻中哪一幀哪一個(gè)像素屬于哪一個(gè)對象,可以用于人臉識別、刷臉識別等應用。
深度學(xué)習的發(fā)展方向就是算法的創(chuàng )新,沈強指出從監督學(xué)習到半監督學(xué)習/無(wú)監督學(xué)習的演化過(guò)程,從依賴(lài)于大數據到只需要小數據,One-Shot Learning。我們知道,監督學(xué)習是依賴(lài)于標簽過(guò)的數據,今天我們講說(shuō)那些人臉識別精度達到多少,以及我們在ImageNet里面,這個(gè)紅線(xiàn)上展示的都是標簽過(guò)的數據,它使我們了解到從數據挖掘智能、挖掘知識的年代。但站在我們的角度來(lái)看,這并不應該成為固守的一個(gè)方向。為什么呢?大量的數據都未標簽過(guò),這都是成本,而成本將阻礙進(jìn)一步創(chuàng )新,擁有數據的大型企業(yè)在人工智能的發(fā)展過(guò)程中會(huì )占據有利地勢,我們怎么樣讓那些創(chuàng )新的想法更快的涌現出來(lái)呢?
如果說(shuō)人工智能的下一步是算法,能夠不依賴(lài)于大量數據或者不依賴(lài)于標簽過(guò)的數據,可以用廣泛的無(wú)標簽的這些數據,這將大大降低我們數據處理的成本,本質(zhì)上使人工智能變得更加民主,無(wú)論大企業(yè)或小企業(yè)都能自主的參與到這一競爭中。為什么ImageNet今年之后將成為絕唱?沈強表示,因為他們的組織者認為在標簽法數據的學(xué)習上面已經(jīng)獲得一定成績(jì),如果再往下做探索的話(huà),會(huì )比現階段更有意義的途徑。我們要相對成熟的看問(wèn)題,往前跳一步去解決那些無(wú)標簽的數據,WebVISION競賽就應運而生,它取代了ImageNet的競賽,其主要特點(diǎn)便是采用的數據都是無(wú)人工標注的??上驳氖菬o(wú)論ImageNet或是WebVISION,中國參賽者都獲得了世界領(lǐng)先的成績(jì),其中碼隆科技便在WebVISION獲得第一名的傲人成績(jì)。
當深度無(wú)監督的學(xué)習被應用起來(lái)時(shí),通過(guò)不同的算法計算出不同的內容,根據條件生成的自動(dòng)網(wǎng)絡(luò ),或是對抗式的神經(jīng)網(wǎng)絡(luò )。我們不必在意兩種算法的區別,因為都會(huì )指出一條道路,人工智能不僅可以用于認知事情,還可以創(chuàng )新更有意義的內容。從波音公司利用對抗式神經(jīng)網(wǎng)絡(luò )設計機翼,利用算法以解決生活中的具體問(wèn)題;從視頻預測利用對抗式神經(jīng)網(wǎng)絡(luò )觀(guān)察未來(lái)發(fā)展,預測危險的可能性,預防更多危險的情況發(fā)生;Deepmind通過(guò)算法的創(chuàng )新強化學(xué)習的創(chuàng )新,以尋找規律、建立模型,這種通用人工智能的創(chuàng )新對半導體產(chǎn)業(yè)的發(fā)展非常有意義。“算法的創(chuàng )新提供無(wú)限的可能性,這將為未來(lái)更多的應用場(chǎng)景落地提供槍支彈藥。”沈強補充道。
在算力方面,智能芯片是人工智能的基石,機器學(xué)習很大程度上依賴(lài)于一個(gè)強大計算的基礎設施。沈強指出,深度學(xué)習的計算量太大,目前有兩種類(lèi)型的計算,基于訓練或基于推理的。訓練可以讓系統學(xué)習數據、獲得模式,而推理是以訓練好的模型或意境學(xué)到的知識,去應用判斷未來(lái)的過(guò)程。這也是為什么Nvidia股票去年漲了四倍,巨大的計算量催生對更高速的計算架構的需求。包括微軟、亞馬遜等公司都已開(kāi)始構建相應的云服務(wù),華為與寒武紀在麒麟970在終端上的合作,提供深度計算加速的設施,英特爾耗費100多億美元去購買(mǎi)人工智能的企業(yè),實(shí)際上就是其背后所提供的計算架構更適合人工智能對算力的需求。
從CPU、到GPU、FPGA深知專(zhuān)用電路應用于不同的場(chǎng)景,我們可以看到演進(jìn)還在持續不斷的發(fā)生,適合于不同的應用場(chǎng)景下面,甚至于最夸張的,像Google Brain項目利用超并行的方法,在一個(gè)芯片上有16000多個(gè)核,16個(gè)芯片作為一個(gè)組,再裝載到機器里面,所以它一臺服務(wù)器里面有256萬(wàn)個(gè)內核。沈強表示,類(lèi)似這樣的創(chuàng )新,包括GoogleTPU的創(chuàng )新,我們在行業(yè)里面也看到很多不停的涌現出來(lái),包括專(zhuān)門(mén)做視覺(jué)的,也有一些不是通用的,而是做一些專(zhuān)用領(lǐng)域的。從蘋(píng)果iPhone X,這個(gè)每秒6500億次計算的小的超小型計算機,到華為Mate 10,這一高達1.92萬(wàn)億次的計算能力的計算機,未來(lái)要處理的場(chǎng)景還需要無(wú)數的模型加載,需要更多深層設施,有不同的神經(jīng)網(wǎng)絡(luò )在里面,以滿(mǎn)足各種各樣的應用場(chǎng)景對巨大計算量的需求。
最后沈強總結道,從場(chǎng)景創(chuàng )新、軟件創(chuàng )新和硬件創(chuàng )新,越來(lái)越多的創(chuàng )新技術(shù)出現,人工智能逐步走入包括消費電子、健康、金融、零售等的各行各業(yè)。人工智能正滲透到行業(yè),成為重塑每一個(gè)行業(yè)的關(guān)鍵力量。如何將創(chuàng )新技術(shù)轉換成商業(yè)價(jià)值,人工智能的業(yè)務(wù)價(jià)值將從2B、2C的方面體現出現,無(wú)論哪一層的實(shí)現都離不開(kāi)軟硬的結合。無(wú)論是安防、無(wú)人機、甚至未來(lái)數萬(wàn)億市場(chǎng)的自動(dòng)駕駛,以及由亞馬遜Echo所引領(lǐng)的智能語(yǔ)音交互,都需要硬件上的感知執行系統,軟件上優(yōu)異的用戶(hù)服務(wù)體現,背后更需要先進(jìn)的人工智能技術(shù)、相應的算法和基礎設置,正是需要技術(shù)的相互結合,為人工智能行業(yè)和半導體行業(yè)的結合提供很好的合作契機。
評論