后深度學(xué)習時(shí)代 人工智能何去何從?
魯迅的文章和人工智能會(huì )有聯(lián)系嗎?在中國科學(xué)院院士、清華大學(xué)教授張鈸看來(lái),答案是肯定的。
本文引用地址:http://dyxdggzs.com/article/201611/339524.htm在魯迅的一篇文章中,當孩子滿(mǎn)月的時(shí)候,凡是說(shuō)孩子將來(lái)會(huì )發(fā)財、做官的,都得到了主人的感謝或恭維,而唯一說(shuō)出事實(shí)——“孩子將來(lái)是要死的”的人遭到了一頓合力的痛打。
張鈸開(kāi)玩笑說(shuō),在當下人工智能大躍進(jìn)的局面下,既要說(shuō)實(shí)話(huà),又不想挨一頓合力的痛打,是需要勇氣的。盡管如此,“我還是既要把人工智能的優(yōu)點(diǎn)和成果說(shuō)夠,也要把它存在的問(wèn)題說(shuō)透?!?/p>
在10月20~22日于山西太原舉行的2016中國計算機大會(huì )(CNCC2016)上,和張鈸有同樣勇氣的還有其他一些人工智能領(lǐng)域的“大咖”。他們將問(wèn)題的核心,都指向了人工智能在后深度學(xué)習時(shí)代的走向。
“彎道超車(chē)”還是又一個(gè)日本“五代機”
作為我國計算機領(lǐng)域目前規模最大、級別最高的學(xué)術(shù)會(huì )議,創(chuàng )建于2003年、由中國計算機學(xué)會(huì )(CCF)主辦的中國計算機大會(huì )一向是業(yè)內人士暢所欲言的舞臺。雖然今年CNCC2016的主題是“計算改變未來(lái)”,但人工智能卻成了事實(shí)上的焦點(diǎn)。
“今年不管開(kāi)什么會(huì )、誰(shuí)組織、在哪里開(kāi),只要和人工智能掛上邊,都很火爆?!敝袊茖W(xué)院副院長(cháng)、中國科學(xué)院院士譚鐵牛對人工智能當下的熱度深有感觸。不過(guò),作為人工智能專(zhuān)家,他深刻地意識到,“與其說(shuō)人工智能火,不如說(shuō)是深度學(xué)習火?!?/p>
從技術(shù)上來(lái)看,深度學(xué)習就是“很多層”的神經(jīng)網(wǎng)絡(luò )。而神經(jīng)網(wǎng)絡(luò )實(shí)質(zhì)上是多層函數嵌套形成的數學(xué)模型。事實(shí)上,在深度學(xué)習出現之前,人工智能已經(jīng)經(jīng)歷了兩次熱潮。在此期間,日本于1981年提出第五代計算機研究計劃, 并為此投資了540億日元。當時(shí),人工智能研究的先驅者之一愛(ài)德華·費根鮑姆認為,這項計劃即使部分實(shí)現,也將產(chǎn)生巨大經(jīng)濟利益,使日本占有市場(chǎng),并奪得統治地位。美國如不自強,事態(tài)將極為嚴重,在超工業(yè)化社會(huì )中只能處于農業(yè)大國的地位。然而,最終這一計劃還是以失敗告終。這也意味著(zhù)人工智能的流派之一符號主義方法進(jìn)入了瓶頸期。
而今,隨著(zhù)深度學(xué)習的出現,人工智能又迎來(lái)了“春天”。這是一個(gè)“彎道超車(chē)”的機會(huì )還是又一個(gè)日本的“五代機”?張鈸認為,“這兩種可能都存在,因為科學(xué)發(fā)現和技術(shù)創(chuàng )新總是通過(guò)默默無(wú)聞的勞作和堅持不懈的努力取得的,只有這樣才有可能成功?!?/p>
在張鈸看來(lái),與30年前相比,現在的人工智能有兩點(diǎn)不同,一是大數據,二是概率統計方法的引入。正是這兩個(gè)因素催生了當下的深度學(xué)習大潮。
然而,深度學(xué)習所解決的問(wèn)題卻有一定的范圍限制,即在一定的應用場(chǎng)景里,在給定的數據庫下,有了可利用的大數據,計算機的感知信息處理程度才有可能達到人類(lèi)的水平。正因為它的局限性,“從狹義的人工智能走向通用人工智能,就成為后深度學(xué)習時(shí)代所要致力的問(wèn)題?!睆堚撜f(shuō)。
不會(huì )“一統江湖、千秋萬(wàn)載”
“從本質(zhì)上說(shuō),(人工智能)第二次和第三次浪潮在方法論上并沒(méi)有本質(zhì)區別,都屬于連接主義。差別在于深度學(xué)習的成功。這里既有硬件的進(jìn)步,也有卷積神經(jīng)網(wǎng)絡(luò )模型與參數訓練技巧的進(jìn)步?!敝袊こ淘涸菏?、北京大學(xué)教授高文認為。但他同時(shí)表示,連接主義(神經(jīng)網(wǎng)絡(luò )、深度學(xué)習)雖然大行其道,但如何解決小數據學(xué)習和創(chuàng )造性思維仍然挑戰巨大。
在南京大學(xué)教授、美國計算機協(xié)會(huì )(ACM)杰出科學(xué)家周志華看來(lái),發(fā)展至今天,作為人工智能領(lǐng)域一個(gè)重要的分支,“機器學(xué)習”已經(jīng)成為一個(gè)廣袤的學(xué)科領(lǐng)域,而“深度學(xué)習”僅是機器學(xué)習中的一個(gè)小分支。
在機器學(xué)習出現之前,人工智能的研究者們意識到,要想提升人工智能水平,僅有邏輯推理能力是不夠的,而要總結出知識再“教”給系統,也同樣困難。到了20世紀90年代中后期,人類(lèi)發(fā)現自己淹沒(méi)在了數據的汪洋中,機器學(xué)習正是為了滿(mǎn)足人們對自動(dòng)數據分析技術(shù)的需求應運而生的。而云計算、大數據時(shí)代的到來(lái),計算能力的大幅提升,使得深度學(xué)習模型在計算機視覺(jué)、自然語(yǔ)言處理、語(yǔ)音識別等眾多領(lǐng)域都取得了較大的成功。
但是,深度學(xué)習是否會(huì )“一統江湖、千秋萬(wàn)載”呢?周志華認為,深度學(xué)習最重要的作用是“表示學(xué)習”,即能自動(dòng)學(xué)習和表達特征。當數據的“初始表示”(如圖像的“像素”)與解決任務(wù)所需的“合適表示”(如描述物體的特征)相距甚遠的時(shí)候,就是深度學(xué)習應用的領(lǐng)域。然而,很多學(xué)習任務(wù),數據的“初始表示”與“合適表示”并沒(méi)有那么遠,因此深度學(xué)習不會(huì )“一統江湖”,其他一些機器學(xué)習技術(shù)也有自己的“用武之地”。未來(lái)深度學(xué)習可能有“冬天”,因為它僅是機器學(xué)習中的一種技術(shù),更“潮”的技術(shù)總會(huì )出現。而機器學(xué)習不會(huì )有“冬天”,除非我們不再需要分析數據。
高文最近和美國國家科學(xué)基金會(huì )(NSF)接觸發(fā)現,美國現在對于深度學(xué)習有很大的爭議。雖然在機器學(xué)習領(lǐng)域,NSF仍然支持深度學(xué)習的基礎理論研究,但認為在應用領(lǐng)域(如計算機視覺(jué)、語(yǔ)音識別、計算語(yǔ)言學(xué)等)使用深度學(xué)習解決實(shí)際問(wèn)題已經(jīng)不算創(chuàng )新,此類(lèi)項目基本上都會(huì )被“殺掉”?!斑@給了我們一個(gè)信號,也許幾年之后深度學(xué)習真的會(huì )進(jìn)入沉寂期?!?/p>
未來(lái)走向
張鈸認為,在后深度學(xué)習時(shí)代,人工智能主要面臨三大挑戰,一是概率統計方法帶來(lái)的困難,即它只能找出重復出現的特征,發(fā)現數據間統計的關(guān)聯(lián)性,卻不能發(fā)現本質(zhì)特征,找到因果關(guān)系。其次是生數據帶來(lái)的困難,實(shí)際上,網(wǎng)絡(luò )數據中只有34%是有用的, 66%則是虛假、無(wú)用的,這會(huì )嚴重影響識別的效果。三是不能舉一反三,進(jìn)行領(lǐng)域遷移。而要想實(shí)現突破,人工智能發(fā)展除了需要知識驅動(dòng)與數據驅動(dòng)結合從而“雙輪驅動(dòng)”外,更加要依靠學(xué)科交叉,特別是數學(xué)、認知科學(xué)、心理學(xué)、神經(jīng)科學(xué)和語(yǔ)言學(xué)等。
從深度學(xué)習的發(fā)展歷史來(lái)看,深度學(xué)習是相對最容易利用新增計算能力的機器學(xué)習方法。因此,周志華預測,未來(lái)的主流技術(shù)未必是深度學(xué)習,但應該是能有效利用 GPU 等計算設備的方法。
對此,周志華的理解是,“好的時(shí)候”要好,“壞的時(shí)候”也不能太壞。而開(kāi)放環(huán)境下的機器學(xué)習研究,是通向“魯棒人工智能”途徑上的關(guān)鍵環(huán)節之一。
談及機器學(xué)習的形態(tài),周志華認為,模型和規約相結合的學(xué)件的出現,將會(huì )改變機器學(xué)習目前算法加數據的現狀,從而突破機器學(xué)習的一些局限,如需要大量訓練樣本,難以適應環(huán)境變化,模型不透明等。今后,當用戶(hù)想要應用一個(gè)模型的時(shí)候,他可以先到“學(xué)件”市場(chǎng)找一找有無(wú)合適的,或者選擇一個(gè)現成的模型加以修改后使用。而“學(xué)件”的誕生,很可能會(huì )催生出一個(gè)新的類(lèi)似軟件產(chǎn)業(yè)的新產(chǎn)業(yè)。
評論