深度學(xué)習也有缺陷,同質(zhì)化的AI創(chuàng )業(yè)競爭將很殘酷
人工智能這一輪的浪潮來(lái)的很快,接連攻克了圖像識別、語(yǔ)音識別、自動(dòng)駕駛等多個(gè)難題,簡(jiǎn)直是處于宇宙中心。從資本、媒體到創(chuàng )業(yè)者都對這個(gè)領(lǐng)域懷有極大的熱情。
本文引用地址:http://dyxdggzs.com/article/201703/344931.htm對于吃瓜群眾來(lái)說(shuō),觀(guān)感大概是這樣:不知不覺(jué),人工智能創(chuàng )業(yè)公司就到處都是了,各大巨頭也紛紛入場(chǎng);一夜之間,AlphaGo狂掃一波頂級棋手,笑傲世界棋壇;下一步,大家是不是該擔心普通人的飯碗不保,以及未來(lái)會(huì )被機器人奴役了?

亞里士多德對自身智能及其模擬也曾發(fā)出過(guò)天問(wèn)
然而假如我們認真地把目光投向這個(gè)上可追溯至公元前300年、下至1956年才正式得名“Artificial Intelligence”的領(lǐng)域,就會(huì )發(fā)現,其實(shí)引起這一波狂潮的不是“人工智能”本身,而是處于這個(gè)領(lǐng)域里的機器學(xué)習中的一項技術(shù):深度學(xué)習。
通過(guò)構建人工神經(jīng)網(wǎng)絡(luò ),它第一次解決了許多人們無(wú)法觸及的難題、讓人工智能前所未有地和人類(lèi)的生活產(chǎn)生交集,也因此獲得了最大限度的關(guān)注。
然而深度學(xué)習真的如此神乎其神嗎?它有沒(méi)有致命缺陷,未來(lái)又在哪里?鈦媒體駐硅谷記者采訪(fǎng)了AI領(lǐng)域的創(chuàng )業(yè)者、學(xué)者、投資人,還注冊了EDX上的人工智能課程,得到了這些初步答案:
深度學(xué)習也有致命缺陷
創(chuàng )投圈對于人工智能的再次關(guān)注,對深度學(xué)習的追捧,其實(shí)就是“人工神經(jīng)網(wǎng)絡(luò )”的一次復興。數十年前,許多學(xué)者曾經(jīng)刻苦鉆研過(guò)它,只是由于當時(shí)技術(shù)的限制,計算能力不足,神經(jīng)網(wǎng)絡(luò )很小很淺,它在吸引一波注意力之后回歸沉寂,也令投資人對它失去了興趣。
隨著(zhù)基礎設施領(lǐng)域的進(jìn)步,計算機的運算能力及數據資源的積累能力在不斷提高,數學(xué)、系統控制、經(jīng)濟等領(lǐng)域的技術(shù)也在不斷融合,人工神經(jīng)網(wǎng)絡(luò )技術(shù)又再一次走上了歷史舞臺。然而這時(shí)候,上一個(gè)“人工智能冬天”的影響猶在,于是有識之士給它換了個(gè)名字來(lái)進(jìn)行下一輪的發(fā)展……
毫無(wú)疑問(wèn),這個(gè)做法奏效了。
在21世紀,深度學(xué)習讓人工智能第一次能夠開(kāi)始解決大眾生活里的問(wèn)題,存在感超強——它的特點(diǎn)是不再像以前一樣依靠硬編碼來(lái)解決各種問(wèn)題,而是通過(guò)搭建一個(gè)模仿人工神經(jīng)網(wǎng)絡(luò )的架構,來(lái)讓機器通過(guò)大量數據訓練而自己找出其中的規律。
其中涉及多層復雜的人工神經(jīng)網(wǎng)絡(luò ),機器在經(jīng)過(guò)大量訓練后最終能夠得出準確率極高的結果。在許多領(lǐng)域,深度學(xué)習技術(shù)都帶來(lái)了令人驚艷的結果:AlexNet,AlphaGo,自動(dòng)駕駛,圖像識別,機器翻譯……
不過(guò),“深度學(xué)習”(也就是“依賴(lài)深度神經(jīng)網(wǎng)絡(luò )的機器學(xué)習”)也有著(zhù)一項幾乎是與生俱來(lái)的缺陷:這些復雜的人工神經(jīng)網(wǎng)絡(luò ),不僅讓向其他人解釋變得困難無(wú)比,就連學(xué)者本身也無(wú)法考證他所創(chuàng )造的系統,是如何得出這個(gè)結果的。
這是一個(gè)可怕的特點(diǎn)——“Uninterpretable”。在學(xué)術(shù)界,這意味著(zhù)人類(lèi)無(wú)法知道機器給出這個(gè)結果的原因。它有可能會(huì )讓你在不知不覺(jué)間,失去“發(fā)現錯誤”的機會(huì )。
機器學(xué)習學(xué)者Rich Caruana描述的一個(gè)事件中,就出現了這樣一個(gè)生死攸關(guān)的“錯誤”:
在匹茲堡大學(xué)的醫療中心里,有一個(gè)小組利用不同的機器學(xué)習技術(shù)預測肺炎患者是否會(huì )患上嚴重的并發(fā)癥。這樣一來(lái),就能讓有較低患上嚴重并發(fā)癥的病人提早出院,來(lái)減少床位壓力及醫護人員的負擔。
然而其中一種可以學(xué)習規則的機器學(xué)習系統輸出了這樣一條規則,讓這個(gè)小組覺(jué)得很奇怪:讓所有患有哮喘的肺炎患者出院。
為了解讀這個(gè)奇怪的規則,他們查閱了醫院規定,發(fā)現了這樣一條:哮喘患者得了肺炎后很容易患上嚴重并發(fā)癥,所以要尤其注意他們。這條規則在這醫院執行的太好了,導致這些脆弱的病人實(shí)際上很少真正患上并發(fā)癥。
這就是機器只看數據的局限性,“我們可能會(huì )不小心害死一些病人?!睂W(xué)者總結道。
這一次,他們用了多種方法,所以通過(guò)基于這種會(huì )輸出規則的方法而發(fā)現了這一點(diǎn)。如果他們僅僅采用了人工神經(jīng)網(wǎng)絡(luò )的話(huà),人們大概只能知道這一部分人被它標記“可以出院”,然后在一段時(shí)間后通過(guò)急劇升高的肺炎并發(fā)癥數量而意識到這一切……
“人工智能只能分析數據,而數據建模與真實(shí)生活之間很難直接劃上等號?!惫韫韧顿Y人郭威這樣告訴記者。當然,這也許并不會(huì )是一個(gè)永遠的缺陷。已經(jīng)有學(xué)者在研究人工神經(jīng)網(wǎng)絡(luò )的“行為習慣”(對就是像研究野生動(dòng)物一樣),希望能通過(guò)這個(gè)過(guò)程找到“解讀”人工神經(jīng)網(wǎng)絡(luò )的方法。
同時(shí),如今的深度學(xué)習技術(shù)還有另一個(gè)問(wèn)題,它需要大量的數據作為訓練基礎,而訓練所得的結果卻難以應用到其他問(wèn)題上。
很簡(jiǎn)單的例子,比如曾經(jīng)虐翻中日韓圍棋天才的AlphaGo,在跳棋賽場(chǎng)上可能就束手無(wú)策了……這也意味著(zhù)花費了很大精力、數據來(lái)訓練的模型,很難跨行業(yè)、甚至只是跨項目的應用。

1997年,國際象棋世界冠軍Garry Kasparov對陣Deep Blue
同質(zhì)化的AI創(chuàng )業(yè)
雖然深度學(xué)習還不是一個(gè)完美的技術(shù),但在它成功地“吸引了全世界的注意力”之后,工業(yè)界的進(jìn)展正不斷加速。
“如今人工智能行業(yè)正處于一個(gè)‘四處開(kāi)花’的階段,能看到不同方向上的創(chuàng )新?!比A盛頓大學(xué)人工智能博士徐宥告訴鈦媒體記者,他曾在FitBit領(lǐng)導機器學(xué)習團隊,離職后也加入了AI創(chuàng )業(yè)浪潮,做了一個(gè)用AI幫助程序員更好地寫(xiě)代碼的公司。
比如上文中提到的Google翻譯,就在某種程度上實(shí)現了類(lèi)似人類(lèi)的遷移學(xué)習能力。毫無(wú)疑問(wèn),這也是一個(gè)未來(lái)很有希望的AI創(chuàng )業(yè)方向。
除此之前,我們還能在模型架構、訓練方法等方面看到各類(lèi)創(chuàng )新。比如DeepMind就提出了完全人工的神經(jīng)網(wǎng)絡(luò )架構,“這可能不是受生物啟發(fā),但是對這個(gè)問(wèn)題理解很深刻才能做到?!毙戾墩f(shuō)。
訓練方法則意味著(zhù)讓機器找到“學(xué)習的方法”(learning to learn)。在人們訓練自己家的小狗時(shí),不同訓練的方法會(huì )帶來(lái)不同的結果;在訓練機器的時(shí)候,這仍然成立。
雖然此刻我們很難預測深度學(xué)習乃至人工智能的未來(lái),但是行業(yè)內有一個(gè)共識——“它會(huì )持續給市場(chǎng)帶來(lái)驚喜,而如今以深度學(xué)習技術(shù)為主的人工智能創(chuàng )業(yè)生態(tài)也將面臨洗牌?!惫τ浾哒f(shuō)道。作為硅谷知名早期投資人,他的成績(jì)顯著(zhù),在CB Insights剛剛發(fā)布的100家變革人工智能產(chǎn)業(yè)的創(chuàng )業(yè)項目榜單里,他投中的就有Skymind,Mode,Atomwise和TalkIQ。
根據VentureScanner今年發(fā)布的數據,全球范圍內的人工智能公司數量達到1464家,其中有超過(guò)三分之一都有關(guān)機器學(xué)習。

在任何一個(gè)對人類(lèi)極其重要、競爭又面臨同質(zhì)化的行業(yè)而言,這個(gè)未來(lái)并不難以想象:在某個(gè)節點(diǎn),巨頭入場(chǎng),end of story。
“真正對人類(lèi)有價(jià)值的問(wèn)題就那么多,巨頭一定不會(huì )把這類(lèi)問(wèn)題讓給大批小公司?!毙戾墩f(shuō),他認為面臨這類(lèi)競爭時(shí),模型上的優(yōu)勢對于創(chuàng )業(yè)公司來(lái)說(shuō),幾乎難以構成護城河。在巨頭進(jìn)場(chǎng)以后,專(zhuān)注于技術(shù)的小型AI創(chuàng )業(yè)公司的慘淡未來(lái)不難預期。徐宥在創(chuàng )業(yè)一段時(shí)間后,寫(xiě)下了這樣一段博文:
目前宣稱(chēng)有獨特模型和算法的,是把賭注押在一個(gè)特定的方法上,而和全世界的所有研究者競爭。目前來(lái)說(shuō)這注定是無(wú)效的——誰(shuí)也不知道明天DeepMind會(huì )公開(kāi)什么黑科技,一下子超越了你的獨特模型?;蛟S在這個(gè)賽道上再走幾年,有些公司的確能夠領(lǐng)先其他。
目前大家都在同樣的起跑線(xiàn)上,模型或者算法的領(lǐng)先可以忽略不計。
就像Oriza Venture的合伙人John Yu在采訪(fǎng)中提到的,面對深度科技時(shí),大眾、乃至有些投資人往往過(guò)度關(guān)注這項科技聽(tīng)上去的“先進(jìn)性”,而忽略了一點(diǎn):除了極其少數的顛覆性技術(shù)以外,大部分科技都必須找到與產(chǎn)業(yè)結合的落腳點(diǎn),在技術(shù)以外的維度上建立起競爭優(yōu)勢,才能夠真正發(fā)揮其價(jià)值,“成為一個(gè)擁有商業(yè)前景的項目”。
對于人工智能企業(yè)來(lái)說(shuō)也是一樣,在圖像處理、語(yǔ)音識別等各個(gè)AI行業(yè)內的問(wèn)題漸漸都被打上“已解決”的標記之際,也許這才是在越來(lái)越激烈的AI賽場(chǎng)上占據一席之地的機會(huì )。
評論