人工智能已到瓶頸!院士“聯(lián)名”反深度學(xué)習 并指出AI未來(lái)發(fā)展方向
前言:
本文引用地址:http://dyxdggzs.com/article/201807/382700.htm在剛剛結束的CCF-GAIR大會(huì )上,來(lái)自清華、加州大學(xué)伯克利、斯坦福、哈工大等多所國內外頂級理工科院校的院士齊聚深圳,分享了自己最新的研究。雖然各自研究的細分領(lǐng)域有所不同,但是透過(guò)貫穿始終的技術(shù)講演,避不開(kāi)的事實(shí)是,多位院士都在或直接或間接的去“批判”深度學(xué)習算法。
演講中,他們再次明確指出深度學(xué)習的缺陷,進(jìn)而點(diǎn)出,在可以預見(jiàn)的未來(lái)里,隨著(zhù)研究的推進(jìn),當下的深度學(xué)習算法將會(huì )逐步被拉下神壇。
不過(guò),順著(zhù)學(xué)術(shù)界走入產(chǎn)業(yè)應用,會(huì )發(fā)現產(chǎn)業(yè)界的關(guān)注重點(diǎn)是在技術(shù)的落地。所謂落地,本質(zhì)上就是無(wú)數應用場(chǎng)景的聚合。所以對于AI企業(yè)而言,對業(yè)務(wù)的探索和用恰當的技術(shù)去解決實(shí)際問(wèn)題才是首當其沖的。
因此,深度學(xué)習存在缺陷,這一問(wèn)題短期內并不會(huì )妨礙AI當下不可阻擋的發(fā)展之勢,技術(shù)的局限也不意味著(zhù)AI公司們將會(huì )無(wú)事可做。
但陽(yáng)春白雪的研究始終引領(lǐng)著(zhù)AI產(chǎn)業(yè)的技術(shù)走向,也是企業(yè)盈利和產(chǎn)業(yè)變革的關(guān)鍵驅動(dòng)力。
所以,在深度學(xué)習被過(guò)度炒熱的當下,我們理應試著(zhù)站在院士們的“肩膀”上,看的更遠。而企業(yè)家們在腳踏實(shí)地的同時(shí),也應當不忘仰望星空。
盡管這已不是什么新鮮的話(huà)題,但是行業(yè)內一直沒(méi)有可以解決問(wèn)題的辦法。本文旨在傳達學(xué)術(shù)界研究者們提供的一些新思路。
機器學(xué)習的弊?。涸从趯Α按蟆钡恼`解
當下,最常被提起的名詞就是機器學(xué)習、深度學(xué)習和神經(jīng)網(wǎng)絡(luò ),用數學(xué)上集合里的概念去理解這三者之間的聯(lián)系,他們之間依次是包含的關(guān)系,即機器學(xué)習包含深度學(xué)習,深度學(xué)習包含神經(jīng)網(wǎng)絡(luò )。其中,四層以上的神經(jīng)網(wǎng)絡(luò )就可以稱(chēng)之為深度學(xué)習,而深度學(xué)習是一種典型的機器學(xué)習。
上世紀五十年代,神經(jīng)網(wǎng)絡(luò )這一算法結構出現,當時(shí),它的正式名稱(chēng)應叫做感知機,但已經(jīng)包含了輸入層、隱含層和輸出層這一經(jīng)典的通用結構,并且隨著(zhù)隱含層層數的加深,對事情的描述就愈加精準。
但是,神經(jīng)網(wǎng)絡(luò )是一種以輸入為導向的算法,所以?xún)?yōu)質(zhì)的結果一定取決于接近“無(wú)窮”量級的數據。因而,在2000年互聯(lián)網(wǎng)革命沒(méi)有爆發(fā)之前,它一直都處在無(wú)人問(wèn)津的階段。
正如大家所知道的,互聯(lián)網(wǎng)時(shí)代積累的大量數據和云計算帶來(lái)的算力的大幅提升,極大地釋放了深度學(xué)習算法(深層的神經(jīng)網(wǎng)絡(luò ))的潛力,因而也讓人工智能時(shí)代全面爆發(fā),產(chǎn)業(yè)應用得以蓬勃發(fā)展。數據顯示,2017年我國人工智能市場(chǎng)規模達到216.9億元,同比增長(cháng)52.8%,預計2018年市場(chǎng)規模將達到339億元。
然而,隨著(zhù)產(chǎn)業(yè)應用的成熟,以及大家對真正“智能”的渴求,讓算力和深度學(xué)習算法本身的局限性,顯露無(wú)疑。
“老百姓概念里的‘大數據’和我們所認為的大數據是完全不一樣的,就拿圖像處理來(lái)說(shuō),數十億的數據量看似量級很高,但對我們來(lái)說(shuō),它其實(shí)是‘小樣本’。因為真正能夠訓練出好的模型的數據量,應當是趨于無(wú)窮的,所以即便是擁有了大量數據去訓練模型,和理想的智能模型之間,也有著(zhù)本質(zhì)的差別?!睆乃惴ㄐ再|(zhì)出發(fā),加州大學(xué)伯克利分校電子工程與計算機系教授馬毅也點(diǎn)出了當下這項火熱技術(shù)的局限性。
因而從學(xué)者、投資人到AI頭部企業(yè),尋找新的技術(shù)和方向成為了現在的重點(diǎn)。
在會(huì )議的開(kāi)場(chǎng)報告中,清華大學(xué)張鈸院士呼吁大家思考的“如何走向真正的人工智能”成為了為期三天會(huì )議的基調,同時(shí)也反映了行業(yè)發(fā)展至當下階段,眾人的訴求。
新方向探索:數據處理方法、基本思想和技術(shù)思路
·數據處理層面,語(yǔ)義向量空間或進(jìn)一步拓寬入口
看見(jiàn)了技術(shù)的“天花板”,很多專(zhuān)家學(xué)者開(kāi)始提出“小數據”的概念,然而清華大學(xué)人工智能學(xué)院院長(cháng)張鈸院士卻不認為數據量的大小是當下的根本問(wèn)題所在,他指出,傳統的人工智能三要素將不能帶來(lái)真正的智能。
“評價(jià)人工智能獲得的成果,我們可以從這五件事來(lái)看:深藍打敗人類(lèi)國際象棋冠軍;IBM 在電視知識競賽中打敗了美國的前兩個(gè)冠軍;2015 年微軟在ImageNet 上做圖象識別,誤識率略低于人類(lèi);百度、訊飛也都宣布在單句的中文語(yǔ)音識別上識別準確度略低于人類(lèi)和AlphaGo 打敗了李世石。前兩件事歸為一類(lèi),后三件事可歸為另一類(lèi)。大家一致認為,這五件事得以發(fā)生的三要素是:大數據、算力的提升和非常好的人工智能算法。但我認為大家忽略了一項因素,就是這所有的成果必須建立在一個(gè)合適的場(chǎng)景下?!?/p>
換言之,當下人工智能的發(fā)展避不開(kāi)種種限制條件,因而智能的機器也只能夠照章辦事,沒(méi)有任何靈活性,也達不到人們想要的智能,而這也就是當下AI的發(fā)展狀態(tài)。
“我們現在的人工智能基本方法有缺陷,而我們必須走向具有理解能力的AI,這才是真正的人工智能?!睆堚撛菏吭谘葜v中指出。
那解決辦法是什么呢?通過(guò)循序漸進(jìn),張院士在演講中給出了思路,并指明語(yǔ)義向量空間這一技術(shù)方向。
“首先,需要明確的是,現有的機器缺乏推理能力的原因在于他沒(méi)有常識?!?/p>
張鈸院士通過(guò)實(shí)驗驗證,常識的建立確實(shí)會(huì )極大程度的提升機器的性能。而為機器建立常識庫也成為人工智能企業(yè)進(jìn)一步提升系統性能的第一步?!懊绹?984 年就搞了這樣一個(gè)常識庫的工程,做到現在還沒(méi)完全做出來(lái)??梢?jiàn),要走向真正的人工智能,有理解的人工智能,是一條很漫長(cháng)的路?!?/p>
但即使在建立常識庫的基礎上,做到有理解能力的人工智能依然不容易。想要提升智能的第二步,在張院士看來(lái),就是將感性和知識的世界統一起來(lái),而這將為人工智能的發(fā)展帶來(lái)一次質(zhì)的飛躍。
“深度學(xué)習之所以能夠極大的促進(jìn)人工智能的發(fā)展,技術(shù)上的關(guān)鍵在于人們能夠將獲取的標量數據轉變?yōu)橄蛄?,從而用到機器上。但至今為止,將行為(特征向量)和數據(符號向量)結合起來(lái)使用始終是科研的難點(diǎn),而這就限制了機器變得更‘智能’?!?/p>
不僅如此,從安全層面來(lái)看,純數據驅動(dòng)的系統也存在很大問(wèn)題——魯棒性很差,易受到很大的干擾。因而,在大量樣本的訓練下,系統仍會(huì )犯重大的錯誤。如商湯、曠視等頭部企業(yè)也表示,即便訓練出的系統模型準確率高達99%,但在實(shí)際應用中,系統仍然會(huì )犯很多“弱智”的錯誤。
“我們現在想出的解決辦法是這樣的,就是把這特征向量空間和符號向量投射到一個(gè)空間去,這個(gè)空間我們把它叫做語(yǔ)義向量空間?!?/p>
怎么做?
張院士指出,第一,要通過(guò)Embedding(嵌入)把符號變成向量,盡量保持語(yǔ)義不丟失;第二就是Raising(提升),結合神經(jīng)學(xué)科,把特征空間提升到語(yǔ)義空間。
“只有解決這些問(wèn)題,我們才能夠建立一個(gè)統一的理論。因為在過(guò)去,對感知和認知的處理方法是不同的,因而兩者不在同一維度,無(wú)法統一處理。但如果我們能夠將感知和認知投射到同一空間,我們就可以建立一個(gè)統一的理論框架,并在語(yǔ)義向量空間里解決理解問(wèn)題。這是我們的目標,但是這項工作是非常艱巨?!?/p>
·基本思想的顛覆,模糊計算或是未來(lái)
“無(wú)論是知識圖譜,語(yǔ)義向量空間還是當下的其他深度學(xué)習訓練,它們都是基于概率統計理論,而模糊邏輯不是,它是以模糊集理論為基礎的?!狈浅4竽懙?,從思想層面,美國猶他州立大學(xué)計算機系終身教授承恒達給出了顛覆性的想法。
其實(shí)模糊邏輯并非全新的概念。1931年,Kurt Godel發(fā)表論文證明了形式數論(即算術(shù)邏輯)系統的“不完全性定理”,模糊邏輯誕生。而在1965年,美國加州大學(xué)的L.A.Zadeh博士發(fā)表的關(guān)于模糊集的論文,標志著(zhù)人類(lèi)首次用數學(xué)理論成功描述了不確定性。
“現在的計算機領(lǐng)域,不是0就是1,而我們描述的是0到1之間的很多不確定性成分,其實(shí),這一過(guò)程描述的是導致結果的原因。以?xún)善克疄槔?,一瓶水上標記‘是純凈水的概率?.91’,而另一瓶水上標記的是‘水的純凈程度是0.91’,你會(huì )選擇哪一瓶呢?顯然,你會(huì )選擇后者。這里的思考判斷過(guò)程就是模糊邏輯,因為后者對于程度的描述本質(zhì)上就是模糊的?!?/p>
目前,類(lèi)似于經(jīng)典邏輯體系(微積分、線(xiàn)性代數、生物學(xué)等衍生學(xué)科),模糊邏輯也逐步形成了自己的邏輯體系。
然而再好的技術(shù),都需要結合應用去展現它的優(yōu)勢。在這一方面,承教授也是格外重視,于是他選擇了乳腺癌的早期診斷研究領(lǐng)域?!暗侥壳盀橹?,我們的設計樣本已經(jīng)被全世界二十多個(gè)國家,五十多個(gè)團隊用來(lái)使用?!?/p>
在承教授看來(lái),現有的技術(shù)存在著(zhù)非常明顯的不足,需要大家沉下心來(lái)去分析問(wèn)題,從而探索到改進(jìn)的方法?!艾F在大家都在模擬腦波中的電信號,但其實(shí)大腦里存在的不僅僅是電信號,還有化學(xué)反應。而很多人在做的醫學(xué)圖像處理,實(shí)際上只是做圖像處理,卻不是醫學(xué)圖像處理,它們之間是有著(zhù)非常大的不同?!?/p>
·技術(shù)思路:大繁至簡(jiǎn)
當下,面對技術(shù)的毫無(wú)進(jìn)展,AI公司的焦慮顯而易見(jiàn)。不同于上面院士教授們給出的具體技術(shù)思路,馬毅教授更像是科技界的“魯迅”,他用PPT中一張張演講稿中的優(yōu)質(zhì)論文做例,只為重新喚醒大家對于A(yíng)I的思考。
“神經(jīng)網(wǎng)絡(luò ),導入的數據有一個(gè)很小的改動(dòng),分類(lèi)就會(huì )有很大的變化,這不是什么新發(fā)現,2010年,大家就遇到這樣的問(wèn)題,但至今沒(méi)有解決?!毖葜v一開(kāi)始,馬毅就拎出了“老生常談”,毫不留情的將一盆冷水澆到了眾多對AI盲目樂(lè )觀(guān)的人身上。
對技術(shù)的不正確認知,馬毅也在極力得糾正。
“在人臉識別領(lǐng)域,要讓算法具有魯棒性,比寫(xiě)個(gè)AlphaGo要困難千倍?!?/p>
“都說(shuō)神經(jīng)網(wǎng)絡(luò )越大越好,這簡(jiǎn)直是胡說(shuō)八道?!?/p>
嬉笑怒罵間,從事研究數年,馬毅給出了自己的思考方向:“真正的優(yōu)質(zhì)算法一定是最簡(jiǎn)單的,比如迭代、遞歸,還有經(jīng)典的ADMM,這些簡(jiǎn)單的算法就很好,也很有用?!?/p>
結語(yǔ)
接下來(lái),人工智能技術(shù)的發(fā)展并不會(huì )樂(lè )觀(guān),尤其是產(chǎn)業(yè)發(fā)展將進(jìn)入一個(gè)平緩期,但是這并不意味著(zhù)學(xué)術(shù)界和產(chǎn)業(yè)界將無(wú)事可做。
正如張鈸院士指出的,“我們正在通往真正AI 的路上,現在走得并不遠,在出發(fā)點(diǎn)附近。但人工智能永遠在路上,大家要有思想準備,而這也就是人工智能的魅力?!?/p>
評論