中國AI研究超美國?專(zhuān)家:比如深度學(xué)習已發(fā)文章數
當今世界人工智能領(lǐng)域,有三位頂級專(zhuān)家被業(yè)內奉為“神一樣的人物”,其中兩位來(lái)自加拿大,一位來(lái)自法國。他們分別是加拿大多倫多大學(xué)的GeoffreyHinton和蒙特利爾大學(xué)的終身教授YoshuaBengio,以及Facebook人工智能研究部門(mén)(FAIR)負責人YannLeCun(下稱(chēng)“LeCun”)——這位來(lái)自巴黎的學(xué)者目前擔任紐約大學(xué)終身教授,他還是紐約大學(xué)數據科學(xué)中心的創(chuàng )始人。
本文引用地址:http://dyxdggzs.com/article/201704/358402.htmYannLeCun在今年3月走進(jìn)中國的大學(xué),在清華大學(xué)和上海紐約大學(xué)分別進(jìn)行了兩場(chǎng)人工智能的頂尖對話(huà),并接受了第一財經(jīng)記者的獨家專(zhuān)訪(fǎng)。
讓機器擁有常識
LeCun是法國學(xué)界非常引以為豪的科學(xué)家,也是在美國科技巨頭公司中擔任要職的為數不多的法國人。雖然同為“極客”,但法國人獨特的氣質(zhì)讓LeCun和很多美國科學(xué)家相比,看起來(lái)更加隨意、富有親和力。
1987年LeCun從巴黎第六代大學(xué)的計算機系畢業(yè)后,就去了多倫多大學(xué)讀博士后,師從“神經(jīng)網(wǎng)絡(luò )之父”GeoffreyHinton,Hinton也是將深度學(xué)習技術(shù)帶入谷歌的人。博士后研究結束后,LeCun就一直工作生活在美國,先后任職于貝爾實(shí)驗室、AT&T等大公司。2008年他創(chuàng )立了一家從事大數據挖掘的咨詢(xún)公司YLC,直到目前,他還擔任他所創(chuàng )立的另一家從事音樂(lè )制作和教育公司的首席科學(xué)官。
目前LeCun領(lǐng)導著(zhù)Facebook人工智能研究部門(mén)近百人的團隊。他的工作是推進(jìn)人工智能的基礎科學(xué)與技術(shù)研究;通過(guò)實(shí)驗來(lái)發(fā)展人工智能技術(shù)在各個(gè)領(lǐng)域中的實(shí)際應用,如計算機視覺(jué)、人機對話(huà)系統、虛擬助手、語(yǔ)音識別和自然語(yǔ)言處理(NLP)等。
“人工智能的背后存在很多基礎科學(xué),它們也許并不面向應用,你的研究可能只是通向對智能和人工智能的理解。”LeCun對第一財經(jīng)記者表示。
LeCun開(kāi)辟了將神經(jīng)網(wǎng)絡(luò )運用于機器視覺(jué)的先例。五年前,其帶領(lǐng)研究人員在圖像識別的準確性上,取得了巨大的突破,這背后的技術(shù)——人工神經(jīng)網(wǎng)絡(luò ),促成了近年來(lái)人工智能的繁榮,也使得谷歌和Facebook得以讓人們在自己的相冊中使用搜索功能,并促成了一批使用面部識別的應用程序問(wèn)世。
訓練機器如何學(xué)習是LeCun的團隊最重要的工作。過(guò)去很長(cháng)一段時(shí)間,他們給機器“喂”了成千上萬(wàn)張圖片,來(lái)教會(huì )機器區分諸如“汽車(chē)”和“小狗”。不過(guò)LeCun在這個(gè)過(guò)程中也拋出了新的問(wèn)題:當有大量可用樣本(比如桌椅、貓狗和人)時(shí),訓練機器沒(méi)有問(wèn)題;但如果機器從來(lái)沒(méi)有見(jiàn)過(guò)這些實(shí)物,它還能識別出樣本嗎?
LeCun表示,人工智能發(fā)展的一大難題就是怎么樣才能讓機器掌握人類(lèi)常識,這是讓機器和人類(lèi)自然互動(dòng)的關(guān)鍵。想要做到這一點(diǎn),它需要擁有一個(gè)內在模型,以具備預測的能力。LeCun用一個(gè)公式簡(jiǎn)潔地概括了這種人工智能系統:預測+規劃=推理。而研究人員現在要做的,就是不需依賴(lài)人類(lèi)訓練,讓機器學(xué)會(huì )自己構建這個(gè)內在模型。
“人們花了很多年來(lái)研究如何給圖片和視頻自動(dòng)加入字幕或描述,從目前的技術(shù)來(lái)看,確實(shí)也已經(jīng)出現了令人印象深刻的實(shí)現方式。”LeCun對第一財經(jīng)記者表示,“但實(shí)際上,它們并沒(méi)有看起來(lái)的那么令人驚艷,那些機器的專(zhuān)業(yè)上很大程度受限于人們訓練它的環(huán)境。你如果向機器展現非常規的情況,大多數機器就會(huì )不知所措,因為它們不具備常識。”
LeCun認為,在機器視覺(jué)領(lǐng)域還有很大的進(jìn)步空間,機器視覺(jué)的下一個(gè)突破將會(huì )是以自主觀(guān)察世界的方式進(jìn)行學(xué)習,比如通過(guò)觀(guān)看視頻來(lái)進(jìn)行學(xué)習。這也意味著(zhù)未來(lái)計算機可能會(huì )像嬰兒學(xué)習那樣掌握常識性的知識。
關(guān)于機器視覺(jué)如何與常識相聯(lián)系,LeCun說(shuō),就連Facebook內部也有很大分歧。“一些人認為可以與智能系統只進(jìn)行語(yǔ)言交流,但是語(yǔ)言是一個(gè)相當低帶寬(lowbandwidth)的渠道,信息密度很低。語(yǔ)言之所以能承載很多信息,是因為人們擁有大量的背景知識,也就是常識,來(lái)幫助他們理解這些信息。”LeCun解釋道。
一些人工智能科學(xué)家認為,給人工智能系統提供足夠信息的唯一方式是加入視覺(jué)認知,因為影像會(huì )比語(yǔ)言的信息密度高得多。比如,你告訴機器“這是一部智能手機”,“這是一輛壓路機”,“有些東西你可以推動(dòng)它而有些不可以”等等,也許機器能夠學(xué)會(huì )這個(gè)世界的基礎運作原理。對此,LeCun表示:“這跟嬰兒的學(xué)習方式類(lèi)似。然而,幼兒在學(xué)習很多事情的時(shí)候并不需要明確的指示。”LeCun認為在沒(méi)有指導的過(guò)程中的學(xué)習才是他想要達到的。
他表示,Facebook很想做到的一點(diǎn)是,讓機器通過(guò)觀(guān)看視頻或觀(guān)察其他東西來(lái)認識現實(shí)世界中的很多局限性,這最終會(huì )讓它們建立起常識。“目前機器還十分好騙,那是因為它們對這個(gè)世界缺乏基本理解。”LeCun說(shuō),“比如將來(lái)你給機器看一小段視頻,然后機器就能預測接下來(lái)會(huì )發(fā)生什么。如果我們能訓練系統做到這一點(diǎn),那么我們就已經(jīng)創(chuàng )造了無(wú)監管指導的機器學(xué)習的核心技術(shù)。這是我們人工智能宏圖的重要組成部分。”
卷積神經(jīng)網(wǎng)絡(luò )
在超過(guò)20年的研究歷程中,LeCun累計發(fā)表了超過(guò)180篇論文,他最廣為人知的研究是1988年參與開(kāi)發(fā)著(zhù)名的卷積神經(jīng)網(wǎng)絡(luò )(convolutionalneuralnetwork,CNN),因此LeCun在業(yè)內也被稱(chēng)為“卷積神經(jīng)網(wǎng)絡(luò )之父”。
卷積神經(jīng)網(wǎng)絡(luò )是近年發(fā)展起來(lái)的一種高效識別方法。其最初的概念形成要追溯到上世紀60年代,科研人員在研究貓腦皮層中用于局部敏感和方向選擇的神經(jīng)元時(shí),發(fā)現其獨特的網(wǎng)絡(luò )結構可以有效降低反饋神經(jīng)網(wǎng)絡(luò )的復雜性,繼而提出了卷積神經(jīng)網(wǎng)絡(luò )。
現在,卷積神經(jīng)網(wǎng)絡(luò )已經(jīng)成為眾多科學(xué)領(lǐng)域的研究熱點(diǎn)之一,特別是在模式分類(lèi)領(lǐng)域,由于該網(wǎng)絡(luò )避免了對圖像的復雜前期預處理,可以直接輸入原始圖像,得到了更為廣泛的應用。這種革命性的系統從一開(kāi)始能夠識別手寫(xiě)數字,并且隨著(zhù)數據訓練的不斷持續,能夠開(kāi)始從圖片像素中識別視覺(jué)特征,這就像為計算機打開(kāi)了雙眼,讓它們可以從數據中自我學(xué)習。
LeCun對第一財經(jīng)記者表示:“如今深度卷積網(wǎng)絡(luò )已可用于解決包括目標識別在內的各類(lèi)計算機視覺(jué)問(wèn)題。并且,隨著(zhù)網(wǎng)絡(luò )深度不斷增加,還出現了可用于圖像識別、語(yǔ)義分割、ADAS等眾多場(chǎng)景的新型深度卷積神經(jīng)網(wǎng)絡(luò )結構。”
Facebook目前正在使用機器學(xué)習實(shí)現一系列不同的功能,這些功能包括人臉識別,機器能從網(wǎng)上識別出人臉,即使這個(gè)人的臉未被標注,因為這一技術(shù)是基于模擬人腦的神經(jīng)網(wǎng)絡(luò )實(shí)現的。
這些網(wǎng)絡(luò )能夠被訓練,并識別信息中的模式,包括語(yǔ)言、文字數據或者視覺(jué)圖像,也是近幾年來(lái)大量的人工智能研發(fā)的基礎。機器系統的下一步任務(wù)將是通過(guò)觀(guān)察現實(shí)世界,學(xué)習世界的運作方式,其中一種方法是通過(guò)與智能手機和可穿戴技術(shù)的互動(dòng)來(lái)學(xué)習。
從事人工智能領(lǐng)域研究20多年來(lái),LeCun的目標就一直是希望賦予機器更大的能力,讓機器變得更加聰明。他對第一財經(jīng)記者表示,在Facebook還有很多想做的事情,還有很多使命尚待完成。“我希望能在Facebook看到新技術(shù)的應用,讓我們的研究變得更有意義,通過(guò)提升機器的深度學(xué)習能力,將它變成智能機器。”
LeCun還認為人工智能未來(lái)能夠無(wú)所不能,包括預測人們的行為。“機器的下一步是能夠通過(guò)觀(guān)察現實(shí)世界的萬(wàn)物來(lái)進(jìn)行學(xué)習,并且預測。”LeCun在最新發(fā)布的推特和Facebook中,多次強調“無(wú)需監管和指導(unsupervised)的機器人前景可觀(guān)”。
他認為,在進(jìn)入到人工智能下一個(gè)階段的突破時(shí),Facebook面臨的最大挑戰將是如何通過(guò)機器學(xué)習將最好的內容與個(gè)人需求相匹配。去年4月,Facebook在F8大會(huì )上推出了Chatbot聊天機器人,能夠幫助人們完成訂餐和行程安排等任務(wù)。在LeCun看來(lái),聊天機器人的終極目標是成為個(gè)人的虛擬助理,通過(guò)人工智能技術(shù)來(lái)連接人類(lèi)和現實(shí)世界,執行日常生活中的任務(wù)。
LeCun對第一財經(jīng)記者表示:“盡管短期我們還只能從一些簡(jiǎn)單的功能應用開(kāi)始做,但我們的遠期目標是建立一個(gè)真正的智能機器,讓你可以與它直接對話(huà),它需要能回答任何問(wèn)題,并對你的生活提供幫助。這件事對于當今的人工智能而言非常具有挑戰性,人機對話(huà)系統、自然語(yǔ)言處理,所有這些的基礎在于讓機器學(xué)會(huì )人類(lèi)的常識。我們現在還不知道到底應該怎么做,但我們對此有很多想法。”
人工智能是長(cháng)期投資
針對目前全球科技巨頭在人工智能方面的激烈競逐,LeCun對第一財經(jīng)記者表示:“沒(méi)有誰(shuí)跑在前面。許多公司都在做著(zhù)大量的人工智能研發(fā),對于人才的競爭也很激烈,但現在并沒(méi)有誰(shuí)發(fā)明了遠遠領(lǐng)先于其他公司的新技術(shù)。”他補充道,沒(méi)有哪家公司的新技術(shù)是需要別人花費三個(gè)月以上才能趕上的,大家的水平都很接近。處于第一梯隊的包括Facebook、谷歌的DeepMind、微軟和IBM。
對DeepMind發(fā)明的AlphaGo取得的成功,他表示:“這是人工智能領(lǐng)域的偉大勝利,我的一些學(xué)生和博士后參與了DeepMind的項目,這一成就建立在所有人的努力之上。”事實(shí)上,分析圍棋棋盤(pán)并決定落子位置的系統實(shí)際上正是LeCun發(fā)明的卷積神經(jīng)網(wǎng)絡(luò )。不過(guò)他也承認,Facebook對圍棋的研究并不多,和DeepMind的系統相比體量相差很多。“我們的圍棋研究主要作為計劃和勘探研究的載體。我們的系統工作得不錯,然后我們把它開(kāi)源了。”
在人工智能的商業(yè)化方面,LeCun表示:“基礎研究的影響在比較長(cháng)時(shí)間后才能體現出來(lái)。你不能幻想種下一顆種子,然后就突然冒出了實(shí)體產(chǎn)品線(xiàn),商業(yè)形式就能發(fā)生徹底改變。這是一種長(cháng)期投資,它需要的是有遠見(jiàn)的人,這樣的人谷歌有,Facebook也有。”
Facebook最近傳出正在組建消費品部門(mén)的消息,對此LeCun向第一財經(jīng)予以證實(shí),不過(guò)他表示,新部門(mén)與他所負責的人工智能部門(mén)是兩個(gè)獨立的團隊,并沒(méi)有直接的聯(lián)系。Facebook確實(shí)在研發(fā)消費市場(chǎng)的人工智能技術(shù),有些是軟件應用,有些是硬件,比如AR、VR和機器人等。“我們正在打造一個(gè)人工智能的生態(tài)系統,能夠將各個(gè)部件與人的生活相連接。”
LeCun主張研究成果的開(kāi)放,讓更多人了解自己正在從事的研究。他表示:“要和大學(xué)實(shí)驗室保持良好關(guān)系,讓這些機構為你輸出各類(lèi)人才,進(jìn)行各種可能的研究,就必須要開(kāi)放項目和成果。假設你是一名科研人員,你肯定總是想公開(kāi)發(fā)表你的研究成果,對于科學(xué)家來(lái)說(shuō)這很重要,因為你的地位在于學(xué)術(shù)影響。你不能簡(jiǎn)單地告訴人們‘我正在為Facebook工作,但我不能告訴你們我在研究什么’,這樣你的職業(yè)生涯就毀了,這很重要。”
人工智能科普大使
機器學(xué)習和深度學(xué)習等人工智能范疇的概念已經(jīng)開(kāi)始逐漸被普通人接受,但真正要理解和表達,對大多數人來(lái)說(shuō)仍然十分困難。為此,LeCun近年來(lái)頻頻走進(jìn)全球高校,積極推動(dòng)人工智能方面的科普工作,他對第一財經(jīng)記者表示:“幫助公眾理解人工智能,對于推動(dòng)整個(gè)行業(yè)的發(fā)展非常重要。”
在中國的行程中,LeCun還參觀(guān)了中科院模式識別國家實(shí)驗室。他在Facebook中發(fā)布的一張和中科院科研人員的合影中寫(xiě)道:“很高興得知中國已經(jīng)有了多個(gè)人工智能的國家級項目。”
他表示:“中國海外投資是很有意思的現象,中國公司的投資途徑基本上是先在本土建立生態(tài)圈,再逐漸滲透到國外,進(jìn)行海外擴張。事實(shí)上當我們看到越來(lái)越多中國企業(yè)投資海外項目時(shí),也應該看到很多歐洲和美國的企業(yè)正在投資中國的人工智能領(lǐng)域。這種資本的流動(dòng)是技術(shù)發(fā)展的必然。”
LeCun還表示,在一些人工智能的領(lǐng)域,中國已經(jīng)超過(guò)美國領(lǐng)先全球。比如在深度學(xué)習方面,根據去年11月美國政府發(fā)布的報告,中國發(fā)表的文章已經(jīng)超過(guò)美國。
但是和美國的科技巨頭相比,中國的研究和技術(shù)仍然有差距。LeCun認為,兩國的人工智能科研實(shí)驗室存在很大差別,“Facebook和谷歌DeepMind的人工智能實(shí)驗室真的是研究非常超前的東西,比如預測學(xué)習和人工智能的未來(lái)趨勢,這是我在其他任何公司都沒(méi)有看到過(guò)的。”
盡管人工智能在中國的應用已經(jīng)無(wú)處不在,從緩解城市交通擁堵,到為司法系統注入透明度。但是現在中國面臨的最大問(wèn)題是專(zhuān)業(yè)人才緊缺。
針對人工智能領(lǐng)域激烈的人才競爭,LeCun表示:“中國占全球五分之一人口,這里擁有非常多的人才,扎克伯格非常重視中國市場(chǎng)。我們也和中國的大學(xué)和院校進(jìn)行人工智能以及很多其他方面的基礎研究合作,這對Facebook是有深刻意義的,但這不是說(shuō)我們已經(jīng)在中國開(kāi)展業(yè)務(wù)了。”
人工智能的快速發(fā)展,不斷帶來(lái)驚喜的同時(shí),也引發(fā)了各種擔憂(yōu)。有一種擔憂(yōu)認為Facebook正在使用人工智能去監視人們的行為。另外,隨著(zhù)人工智能的迅速增長(cháng),很多人擔心機器人很快就會(huì )代替人類(lèi),甚至掌管整個(gè)世界。
LeCun表示:大可不必如此擔心。“盡管人工智能發(fā)展安全系統的學(xué)習曲線(xiàn)是在向上的趨勢,但機器最終還是會(huì )被人文社會(huì )均衡所控制。也許一個(gè)假設情境中的對沖基金可以通過(guò)破壞經(jīng)濟體系幫助人類(lèi)實(shí)現收益最大化,但是這些行為最終會(huì )受到社會(huì )和法律制度的約束。”
LeCun曾在自己的Facebook上貼出一張美國漫畫(huà)作家比爾·沃特森(BillWatterson)的著(zhù)作《凱文的幻虎世界》(CalvinandHobbes)中的一張漫畫(huà),圖中6歲的男孩和老虎躺在草坪上,他們并不能明白對方的世界。漫畫(huà)中寫(xiě)道:“如果我都不知道你為什么大笑,我們的生活將沒(méi)有太多的共鳴。”這段話(huà)也是LeCun對于人工智能和人類(lèi)關(guān)系的總結:有機遇也有挑戰,充滿(mǎn)著(zhù)迷人和激情的色彩,但又讓人有未知的恐懼。
評論