從IBM、谷歌、亞馬遜看當下AI的泛化
曾幾何時(shí),AI(人工智能)成為了諸多企業(yè)的口頭禪,不管這個(gè)企業(yè)身處什么產(chǎn)業(yè),是什么樣的企業(yè),好像不帶上AI就落伍了,媒體更是天天充斥著(zhù)各種AI的報道,我們也是聽(tīng)得耳朵磨出了糨子。在此我們不妨以業(yè)內公認的AI或技術(shù)或市場(chǎng)中的代表IBM、谷歌和亞馬遜為例,看看AI的技術(shù)和市場(chǎng)究竟如何?
本文引用地址:http://dyxdggzs.com/article/201707/362145.htmIBM“沃森”(IBM Watson):被疑為噱頭 商業(yè)化成本高企無(wú)實(shí)效
提及沃森,這個(gè)自從 6 年前在美國答題秀節目Jeopardy 中打敗人類(lèi)選手,就占據了無(wú)數的新聞頭條,并最早商業(yè)化(主要用于醫療領(lǐng)域癌癥的檢測和預防)的所謂AI系統。不過(guò),隨著(zhù)時(shí)間的推移,近期沃森卻屢屢遭受業(yè)內的質(zhì)疑。

例如華爾街投行杰富瑞分析師詹姆斯基斯納(James Kisner)發(fā)布的關(guān)于IBM人工智能“沃森”(IBM Watson)的研究報告就稱(chēng):IBM對沃森的投資很難給股東帶來(lái)價(jià)值回報,并用案例說(shuō)明了IBM沃森存在的廣泛?jiǎn)?wèn)題,即該案例來(lái)自IBM沃森與MD安德森癌癥中心之間的合作,即在向沃森項目浪費了6000萬(wàn)美元之后,MD安德森癌癥中心最終停止了與IBM在這方面的合作,并承認這項技術(shù)尚未準備好臨床使用。而MD安德森癌癥中心的情況并非個(gè)案。多名人工智能領(lǐng)域的創(chuàng )業(yè)者都表示,他們在金融服務(wù)和生物科技領(lǐng)域的客戶(hù)在與IBM打交道時(shí)都有過(guò)類(lèi)似經(jīng)歷。
與華爾街投行的分析相比較,今年五月,在CNBC的金融市場(chǎng)觀(guān)察欄目“Closing Bell”上,風(fēng)險投資人Chamath Palihapitiy更是語(yǔ)出驚人:“實(shí)話(huà)實(shí)說(shuō),Watson就是個(gè)笑話(huà)。我認為,IBM非常擅長(cháng)利用銷(xiāo)售和營(yíng)銷(xiāo)手段,來(lái)誘導信息不對稱(chēng)的人掏腰包。”
而美國認知科學(xué)會(huì )創(chuàng )始人 Roge Schank認為 沃森根本不是認知計算系統,IBM 有夸大吹噓嫌疑,并做了如下論證,即為了展示沃森的超凡智能,IBM 從 2015年以來(lái)在熱播電視節目中投放了沃森的廣告。在廣告中,沃森程序與搖滾靈魂人物鮑勃迪倫進(jìn)行了對話(huà)。
對此,Schank 指出,這個(gè)廣告恰恰說(shuō)明沃森完全沒(méi)有理解迪倫的作品。盡管“時(shí)間流逝”之類(lèi)的詞匯在迪倫的作品中時(shí)常出現,但所有熟悉迪倫作品的人都知道,迪倫是一位抗爭歌手,他的歌曲最關(guān)心的是民權、反戰這些主題。不過(guò),迪倫歌的歌詞里并沒(méi)有直白地寫(xiě)著(zhù)“反戰歌曲”、“民權運動(dòng)”。沃森只根據詞頻統計等方式找到“時(shí)間流逝”、“愛(ài)情凋零”,而沒(méi)有真正理解迪倫作品的真正主題。
谷歌DeepMind:除了圍棋 技術(shù)與商業(yè)化類(lèi)“沃森”前景不明
至于谷歌,去年AlphaGo依賴(lài)人工智能挑戰號稱(chēng)最難的人類(lèi)游戲圍棋大獲成功,讓人工智能背后的“深度學(xué)習”廣為人知,也把谷歌此前收購的AI科技公司DeepMind推到了公眾面前。對此,就像前微軟亞洲研究院常務(wù)副院長(cháng)芮勇所言,想要實(shí)現真正的人工智能還有很長(cháng)的路要走,今天所有的人工智能幾乎都是來(lái)自于人類(lèi)過(guò)去的大數據,沒(méi)有任何一個(gè)領(lǐng)域的能力源自自我意識,不管是象棋還是圍棋,計算機都是從人類(lèi)過(guò)去的棋譜中學(xué)習。假如讓AlphaGo去下跳棋,它就會(huì )完全傻掉。甚至說(shuō)把圍棋的棋盤(pán)稍作修改, AlphaGo都招架不住,但是人類(lèi)就沒(méi)有問(wèn)題。AlphaGo可以打敗三十多歲的李世石,但它的學(xué)習能力不及一個(gè)5歲的小孩,這二者是有很大區別的。

與沃森相比,DeepMind則剛剛進(jìn)入商業(yè)領(lǐng)域的應用。去年七月,谷歌宣布DeepMind已找到方法將谷歌數據中心的制冷用電量減少2/5。它的算法先分析數據中心的操作日志來(lái)理解任務(wù),然后通過(guò)反復模擬運行來(lái)優(yōu)化過(guò)程。同樣,DeepMind也已經(jīng)進(jìn)入醫療行業(yè)。去年11月,公司獲得了首個(gè)付費項目,與NHS公立醫院皇家自由倫敦醫院(Royal Free London)簽下五年的合同,為其處理170萬(wàn)份病歷。此外,DeepMind還獲得了訪(fǎng)問(wèn)其它倫敦醫院兩個(gè)數據庫的權限,即DeepMind利用AI軟件分析了約100萬(wàn)份視網(wǎng)膜掃描報告成功找到了退行性眼疾的早期征兆,或通過(guò)頭頸部癌癥圖像讓AI軟件學(xué)會(huì )區分健康和癌組織之間的不同。
從上述DeepMind的商業(yè)化看,與沃森類(lèi)似,均需要首先獲取現實(shí)世界的大數據,即使擁有大量數據的可供挖掘的谷歌,運用AI及機器學(xué)習技術(shù)改進(jìn)醫院、電網(wǎng)及工廠(chǎng)等系統時(shí),獲取其具體操作數據也非常重要。原因很簡(jiǎn)單,沒(méi)有人類(lèi)提供的背景數據,哪怕極為簡(jiǎn)單的挑戰,現有的AI技術(shù)也無(wú)法勝任。因此,當前的AI技術(shù)實(shí)際上并不“智能”,也不是解決問(wèn)題的萬(wàn)能手。
提及數據,在人機大戰前,DeepMind耗費了數年時(shí)間學(xué)習圍棋。參加《危險邊緣》問(wèn)答的沃森,研發(fā)人員輸入了數TB有關(guān)問(wèn)答節目和自然語(yǔ)言實(shí)例的數據,來(lái)幫助它理解這一節目的問(wèn)答模式。只有靠人類(lèi)這樣有針對性的密集“訓練”,這些機器才能表現得如此出色。會(huì )議安排助手X.ai這類(lèi)看似簡(jiǎn)單的應用程序卻花費了數年時(shí)間學(xué)習與會(huì )議安排相關(guān)的事項,才達到可投入商用的水平。而它們運作的過(guò)程,更類(lèi)似于基于計算力提升之下的大數據分析和輸出,遠沒(méi)有創(chuàng )造性的推理。而眾所周知的事實(shí)是,在數據的處理(其實(shí)就是一種高速的運算),機器的能力早已經(jīng)遠遠超過(guò)人類(lèi)。
對此,有分析稱(chēng),DeepMind未來(lái)可能無(wú)法單單通過(guò)利用AI程序解決復雜問(wèn)題的方式創(chuàng )造大量營(yíng)收,但DeepMind AI軟件通過(guò)分析數據所獲取的有用信息已經(jīng)足夠讓谷歌為當初的競標所投入的巨資值回票價(jià)??吹竭@里,相信業(yè)內應該知道DeepMind的本質(zhì)以及谷歌打著(zhù)AI旗號的真實(shí)目的了吧。
亞馬遜Alexa:仍屬快速信息檢索 涉及自然語(yǔ)言識別折戟沉沙
最后看亞馬遜。其所謂的AI是隨著(zhù)采用智能語(yǔ)音技術(shù)Alexa的Echo音箱的熱銷(xiāo)而為業(yè)內所知,某種程度上也代表了亞馬遜AI的水平。但從其應用看,智能語(yǔ)音服務(wù)范圍大都是在信息檢索,幫助用戶(hù)獲得資訊。絕大多數的內容是不牽涉“推理”(對用戶(hù)自然語(yǔ)言的理解)的查詢(xún)類(lèi)信息服務(wù)。如果用戶(hù)問(wèn)到在基礎信息以上,一旦牽涉推理的問(wèn)題,不僅是Alexa,幾乎所有的智能語(yǔ)音識別(包括谷歌、微軟)都無(wú)能為力。

以亞馬遜的Alexa為例,去年一名六歲的女孩在跟Echo內置人工智能語(yǔ)音助手Alexa聊天時(shí),意外訂下了價(jià)值170美元的玩具和一盒重達四磅的餅干。雖然孩子的媽媽在收到一個(gè)不知打哪來(lái)的訂單確認電話(huà)后立刻進(jìn)行了取消操作,但該訂單卻已經(jīng)被處理,且一個(gè)跟孩子身高幾乎相同的玩偶就在隔天送來(lái)了。最后,他們無(wú)奈地決定將這一玩偶捐贈給當地兒童醫院。
又如亞馬遜Alexa誤聽(tīng)指令向孩子提供成人內容,即小孩向亞馬遜Alexa下達指令:“Alexa,請播放‘Digger digger(一首兒童歌曲)’。”之后,亞馬遜個(gè)人助手通過(guò)算法進(jìn)行識別,竟然認為孩子想聽(tīng)情色內容。稍后,孩子的父母才意識到發(fā)生了什么事,可惜他們已經(jīng)無(wú)法阻止Alexa繼續播放聲音。
上述說(shuō)明自然語(yǔ)言(真正的AI能力)的“難題”離最終的解決依然存有差距。因為不同的應用(問(wèn)答、情感分析、機器翻譯、部分語(yǔ)音標簽)需要有不同的模型架構:強監督式記憶神經(jīng)網(wǎng)絡(luò )、樹(shù)形長(cháng)短記憶網(wǎng)絡(luò )、雙向LSTM限制隨機域(CRF)、動(dòng)態(tài)記憶網(wǎng)絡(luò )等。即使在研究中出現一些非常有潛力的新想法,設計、工程合成、可擴展的對話(huà)系統與這些想法的結合依然處于非常復雜的狀態(tài),離商用還很遙遠。所以,當被問(wèn)及何時(shí)才能通過(guò)自然語(yǔ)言與數字助理交流,并得到滿(mǎn)意的答案時(shí),就連吳恩達這樣的頂尖科學(xué)家也無(wú)法給出確切答案。即便是對最高水平的神經(jīng)網(wǎng)絡(luò )學(xué)家而言,這項技術(shù)仍然有很多謎團尚待解開(kāi)。有很多工作只能通過(guò)不斷試錯來(lái)改進(jìn),沒(méi)有人敢保證某項技術(shù)調整可能產(chǎn)生什么樣的后果。根據現有的技術(shù)和方法,這一過(guò)程大約要耗費數年時(shí)間。
正是在這些科技大佬的鼓動(dòng)下,AI正有走向泛化的趨勢。據統計,到去年年底,在財富500強企業(yè)中,就有180家對外宣稱(chēng)自己要啟動(dòng)相關(guān)的人工智能項目。甚至有廣告研究公司大膽預估,到了 2020 年,人工智能技術(shù)可能會(huì )出現在幾乎所有的新科技產(chǎn)品的宣傳之中。另?yè)礼artner 在研究了 1000 家宣稱(chēng)自己使用了人工智能的技術(shù)供應商后發(fā)現,大部分所謂的人工智能技術(shù),采用的依舊是基礎的、基于規則的機器學(xué)習和分析技術(shù)(例如上述的IBM的沃森和谷歌的DeepMind)。這些技術(shù),早在人工智能這個(gè)概念被熱炒之前,就已經(jīng)出現并被業(yè)內所使用。更為關(guān)鍵的是,這些技術(shù)的能力遠遠未達到可以被稱(chēng)得上“人工智能”的程度。
恰逢國務(wù)院《新一代人工智能發(fā)展規劃》頒布之際,在彰顯我國政府對于科技產(chǎn)業(yè)前瞻性和勢在必得決心的同時(shí),也應該警惕當下產(chǎn)業(yè)界AI泛化的趨勢,尤其是在每逢大的利好的產(chǎn)業(yè)政策或者綱要出臺,總是泥沙俱下的中國,切莫讓真正的AI淹沒(méi)在A(yíng)I的泛化中。
評論