阿里云創(chuàng )始人王堅院士:計算驅動(dòng)當今的發(fā)現和創(chuàng )新
2023 年10 月,CNCC2023(2023 中國計算機大會(huì ))在沈陽(yáng)召開(kāi),中國工程院院士、之江實(shí)驗室主任、阿里云創(chuàng )始人王堅博士做了“計算驅動(dòng)的科學(xué)發(fā)現和科技創(chuàng )新”主旨講演,認為20 世紀是電驅動(dòng)的時(shí)代,現在是計算驅動(dòng)的時(shí)代。云計算將是未來(lái)趨勢,于是王堅院士等人當年創(chuàng )辦了阿里云。過(guò)去的很多思想是靠假設來(lái)驅動(dòng)的,數據最重要的作用是幫助人們產(chǎn)生新的假設。計算驅動(dòng)是計算密集型、數據驅動(dòng)和基于模型的完美結合。
本文引用地址:http://dyxdggzs.com/article/202312/454368.htm1 20世紀是電氣化驅動(dòng)的
之前的科學(xué)發(fā)現和創(chuàng )新是被什么驅動(dòng)的?圖1是美國工程院對20 世紀最偉大的工程技術(shù)發(fā)明做的調查,可見(jiàn)第一項是電氣化。
表1 20世紀最偉大的工程技術(shù)發(fā)明
如今,電氣化已非常普遍。例如,人們在依靠照明的會(huì )議室里召開(kāi)“2023 中國計算機大會(huì )”,如果沒(méi)有電氣化,這是無(wú)法完成的。如果仔細看表1,也很有意思,像激光、互聯(lián)網(wǎng)、計算機等排在電氣化之后,而你再往深層次想象,如果沒(méi)有電氣化,可能后面很多的發(fā)明都不會(huì )存在,所以電氣化對人類(lèi)社會(huì )的推動(dòng)是非常巨大的。
2 今天是數據驅動(dòng)的時(shí)代
計算能否像電氣化一樣,扮演著(zhù)超過(guò)人們今天想象的對社會(huì )發(fā)展起著(zhù)根本推動(dòng)的角色?
回顧歷史,20 世紀就是一個(gè)被電驅動(dòng)來(lái)做創(chuàng )新的時(shí)代。從1882 年開(kāi)始,電第一次作為一種公共服務(wù)被提供的時(shí)候,世界就發(fā)生了一次巨變。
電力作為一種公共服務(wù)是由愛(ài)迪生倡導的,盡管他發(fā)明的是直流電,最后交流電替代了直流電作為了公共服務(wù)的標準。但是不管怎樣,愛(ài)迪生的發(fā)明仍然被認為是電力革命的里程碑,因為使得電力可以被有效地傳輸和使用。之后,因為有了電氣化,全世界的城市發(fā)生了一次天翻地覆的變化。所以電氣化推動(dòng)了城市的進(jìn)步。關(guān)于數據驅動(dòng),如果把計算放到一個(gè)更廣的視野里來(lái)看,數據驅動(dòng)究竟要改變什么?
關(guān)于數據非常有意思:世界上所有城市只占了地球表面積的2%~3%,但是今天容納了大概全球60% 的人口,預計到2025 年將容納80% 的人口,這意味著(zhù)更多的人會(huì )到城市里來(lái),不管你愿意不愿意,不管城市病有多嚴重,但是一個(gè)很挑戰的事情就是世界上所有城市消費了超過(guò)74% 的世界能源。從發(fā)展的角度來(lái)看,我們面臨的挑戰可能比想象的要大、緊迫。
當年IBM 首次提出smart city(注:源自IBM 的“智慧地球”),人們翻譯為智慧城市,實(shí)際上叫“靈巧城市”更為恰當。里面有一個(gè)數據,對一座城市而言,大概有35% 以上的水是被漏掉的(注:即使打開(kāi)水龍頭把水放掉都不算漏掉)。所以可以設想一下,一家水廠(chǎng)35% 的水就無(wú)聲無(wú)息地消失了,但是人們拿它沒(méi)有任何辦法。這個(gè)問(wèn)題并沒(méi)有隨著(zhù)技術(shù)、信息化技術(shù)的發(fā)展被解決掉。
根據愛(ài)爾蘭的調查,該國2018 年約有46% 的水從自來(lái)水管網(wǎng)被漏掉。多么驚人的資源浪費!希望2021年能夠把漏水量降到38%,到了2030 年這個(gè)比例降到25%,即1/4 的水被管網(wǎng)漏掉。
所以人們認真想一下,這個(gè)世界面臨的挑戰比我們在某一個(gè)領(lǐng)域看到的挑戰要大得多。
根據這個(gè)數據,你會(huì )發(fā)現,漏水的多少跟一座城市發(fā)展的水平?jīng)]有關(guān)系。因此,人們平時(shí)講綠色、可持續發(fā)展,面臨的挑戰或數字可能是超乎想象的。
那么再回到它的原點(diǎn),也就是說(shuō)這些問(wèn)題都帶來(lái)了電氣化的問(wèn)題,所以人們可以人們看到圖1 的水平紅線(xiàn),我們平時(shí)講到2050 年或2060 年,我們要達到碳中和水平的碳排放量。
所以人們看到一件很有意思的事情:事實(shí)上,今天的碳排放量是隨著(zhù)1850 年以后電氣化大規模普及而帶來(lái)的,之后呈這樣一條指數型的曲線(xiàn)上去。所以人們認真想一下,如果我們要在2050 年把它回到碳中和狀態(tài),要有一條更陡的曲線(xiàn)把它降下來(lái)。
為什么要談數據驅動(dòng)的科學(xué)發(fā)現和創(chuàng )新?
人們認真想一想,從1950 年到今天,這條碳排放的曲線(xiàn)能這樣爬上來(lái),從另外一個(gè)角度,也是得益于科技的創(chuàng )新和發(fā)現。
圖1
所以這是一個(gè)非常有意思的分水嶺,是科技和創(chuàng )新的發(fā)現,使得人類(lèi)消耗自然資源的能力被極大地提升了,造成了今天的碳排放量水平。從另外一個(gè)角度,撇開(kāi)我們所有的觀(guān)念的話(huà),我們得問(wèn)一個(gè)非常嚴肅的問(wèn)題:在接下去的二三十年,我們能不能用更短的時(shí)間、更快的速度把碳排放量降下來(lái)?那么就得靠我們平時(shí)常講的數字化。
人們設想一下,計算和數字化的關(guān)系就是電和電氣化的關(guān)系,這就是為什么要談到計算驅動(dòng)的科學(xué)發(fā)現和創(chuàng )新,最后的結果使得我們有機會(huì )在2050 年或2060 年把碳排放量能降到我們今天希望的碳中和的水平。
從這個(gè)角度講,給這個(gè)學(xué)科帶來(lái)一次非常難得的機會(huì )。如果設想一下今天的數字化跟100 年前的電子化來(lái)相比,計算在這里扮演的角色就是非常值得期待的。預計:計算驅動(dòng)(Computing-driven)的計算是會(huì )在21 世紀接下來(lái)的100 年重新發(fā)明所有的事情,包括城市在內。
3 “計算”的內涵和外延
有三個(gè)詞很重要,它們是有關(guān)系的。Computing( 計算) 的含義是非常豐富的。如果去看文獻,可以看到Computing( 計算) 是早于Computer (計算機)這個(gè)詞,即計算是早于計算機這個(gè)詞出現的。所以在王堅院士的語(yǔ)境里,Computing( 計算) 這個(gè)詞包含了三個(gè)很有意義的組成部分。
在今天的人工智能環(huán)境的語(yǔ)境下,computing ( 計算) 可以看想象成這三個(gè)詞的綜合:① computational intensive, 王堅院士對這個(gè)詞斟酌了很久,認為指“計算”密集型,盡管到了中文的翻譯, 此“ 計算(computational)” 非彼“ 計算(Computing)”。② 數據驅動(dòng)。③基于模型。
從計算密集型角度,人們會(huì )想到超算。摩爾定律(圖2)顯示了計算是怎么發(fā)生、發(fā)展的,其速度超過(guò)任何一個(gè)領(lǐng)域的速度。
圖2 摩爾定律示意圖
同樣很有意思的是人們很熟悉的,今天做人工智能的時(shí)候,會(huì )談到英偉達的A100 和H100 顯卡。如果把時(shí)間稍微拉長(cháng)一點(diǎn),會(huì )發(fā)現英偉達GPU 從3 億個(gè)晶體管(GeForce 7800)到今天800 億個(gè)晶體管(H100),增長(cháng)速度是非常驚人的。在早期集成電路出來(lái)的時(shí)候只有2 個(gè)晶體管,英特爾在70 年代初的第一個(gè)芯片只有2000 多個(gè)晶體管。所以可以設想一下,從一只手就能數出來(lái)的數量,到人生一輩子都數不完的800 億個(gè)晶體管,計算的物理基礎發(fā)生了非常大的變化(圖3)。
圖3
2006 年Jeannette Wing 提出一個(gè)想法,盡管沒(méi)有流行起來(lái):Computational Thinking,慢慢改變了人們的思維。所以“計算”是非常值得深思的,中文一個(gè)詞“計算”很難反映深刻的內涵和外延(圖4)。
圖4
2007 年Gordon Bell( 美國微軟灣區研究中心高級研究員,高性能和并行計算領(lǐng)域先驅) 講“計算”這件事情,講到 HPC 計算會(huì )被挑戰的時(shí)候,他在PPT 里寫(xiě)了這么一句話(huà),可能云的服務(wù)能夠慢慢來(lái)支持高性能計算(HPC)。人們會(huì )發(fā)現,當計算發(fā)展到一定程度時(shí),關(guān)于云的思考就會(huì )被自然而然地帶出來(lái)。所以計算computational,即使到今天還是值得我們認真地來(lái)思考。
4 從假設驅動(dòng)到數據驅動(dòng)
人們比較熟悉的,當年有一個(gè)所謂的第4 范式,叫做數據驅動(dòng)科學(xué)發(fā)現。曾經(jīng)扮演一個(gè)非常重要作用的人叫Jim Gray,他當年在微軟研究院工作,他個(gè)人也很傳奇,在2007 年一次出海后就消失了,也沒(méi)有證據消失在哪里。
他的書(shū)《The Fourth Paradigm——Data-Intensive Scientific Discover》 ( 第四范式——數據密集型科學(xué)發(fā)現) 是在他身后出版的。很有意思的是他生前最后一次講演就是關(guān)于數據驅動(dòng)。
那么這里就有一個(gè)問(wèn)題,在數據驅動(dòng)以前的科學(xué)研究到底是由什么來(lái)驅動(dòng)?
王堅院士認為:很多的科學(xué)發(fā)現,或者今天的很多思想是靠假設來(lái)驅動(dòng)的。
所以王堅院士的觀(guān)點(diǎn)是什么?數據驅動(dòng)不是拿數據來(lái)證明或者解決你的假設,數據最重要的作用是幫助你來(lái)產(chǎn)生新的假設。所以到了一個(gè)新的科學(xué)發(fā)現的階段——數據驅動(dòng)的科學(xué)發(fā)現。
這句話(huà)很抽象,但在一些學(xué)科的發(fā)展過(guò)程中有非常有意思的例子。例如英國著(zhù)名天文學(xué)家Fred Hoyle 爵士曾在1948 年時(shí)設想從外太空看地球是什么樣,他的假設是:一旦有人從外太空拍攝一張地球的照片,一種前所未有但無(wú)可辯駁的全新觀(guān)念就會(huì )誕生。1972年人類(lèi)第一次到太空拍攝了地球的照片,人們才有一個(gè)概念叫藍色地球。這張照片從根本上改變了一件事情:突然發(fā)現不是一點(diǎn)點(diǎn)地研究地球,而是應該把地球當作一個(gè)整體來(lái)研究。因此出現了地球系統科學(xué)。人們看到了三條主軸線(xiàn):地球系統科學(xué)的出現跟一些機構有關(guān)系,跟一些研究也有關(guān)系,但很有意思的是覺(jué)得跟這張照片緊密相關(guān)。
所以數據會(huì )改變很多今天我們自己不會(huì )注意到的東西。
可見(jiàn),無(wú)論是假設驅動(dòng)還是數據驅動(dòng),都會(huì )改變我們很多想法。
人們可能知道哈勃望遠鏡和很多天文學(xué)的研究,但是當王堅院士在看這些文獻的時(shí)候,有一句話(huà)是深深打動(dòng)他的,哈勃從一個(gè)沒(méi)有任何認知的地方去拍照,而給我們帶來(lái)了對宇宙的一種全新的認識。這就是為何是數據驅動(dòng)、不是假設驅動(dòng)的科學(xué)發(fā)現和創(chuàng )新的時(shí)代。
望遠鏡第一次出來(lái)的時(shí)候大概也是類(lèi)似狀態(tài),那時(shí)并不是因為知道太陽(yáng)系是什么樣子,只不過(guò)是因為有了望遠鏡,讓我們慢慢清楚太陽(yáng)系是怎么工作的。所以數據會(huì )深深地改變我們對很多事情的看法。
再回到模型,也是很有意思的。人工智能從1947年開(kāi)始到今天,此“人工智能”已非“彼人工智能”,方法論、邏輯、假設等不一樣。已到了一個(gè)基于模型的時(shí)代。
如圖5,盡管只總結到了2020 年。ChatGPT 是在2022 年底、2023 年初突然火爆起來(lái)的。如圖5 會(huì )發(fā)現,很多年前人們對于模型的收斂已經(jīng)到了GPT 上,只不過(guò)人們并沒(méi)有意識到其會(huì )這么徹底改變我們對這么一個(gè)學(xué)科/ 領(lǐng)域的重新的認識。
圖5
所以從這個(gè)角度,GDP 在2022 年底、2023 年初火起來(lái)是有一點(diǎn)后知后覺(jué)的。
從圖5 可以看到,其實(shí)很早就應該火起來(lái)。當然結果就是中間穿插了一件事情,就是AlphaFold(注:2018 年DeepMind 公司開(kāi)源的人工智能系統, 借助AlphaFold 可以更準確地預測蛋白質(zhì)的形狀。)出來(lái)的時(shí)候, 當時(shí)一篇文章中有這么一句話(huà),biology’s ImageNet Moment(生物學(xué)的ImageNet 時(shí)刻)(如圖6)。
圖6
從事計算機學(xué)科的人會(huì )非常驕傲的,ImageNet 在那時(shí)推動(dòng)了很多事情的發(fā)展,現在會(huì )有人把它作為一個(gè)非常重要的思考/ 研究的方式。這句話(huà)的本質(zhì)是:未來(lái)的研究要基于平臺,ImageNet 就是平臺的一個(gè)非常重要的代表。ImageNet 是集計算(computational)、數據驅動(dòng)、模型為一體的載體,只是那時(shí)人們簡(jiǎn)單的把它想象成一個(gè)數據集。
總結一下什么叫“生物學(xué)的ImaginNet 時(shí)刻”,就是GDT+ 的時(shí)候。這是我們第一次能夠把理論框架收斂、集中的方法上。
今年英偉達的CEO 黃仁勛說(shuō):ChatGPT 是AI 的iPhone 時(shí)刻。套用了前面的那句話(huà)。所以這個(gè)時(shí)候很多事情、關(guān)系發(fā)生了一些有趣的變化。
當模型走在一起的時(shí)候,黃仁勛又說(shuō)了另外一句:最后人工智能和超級計算怎么被人們用?最后還是要回到云的服務(wù)(圖7)。
圖7
吻合了。2009 年王堅院士開(kāi)始做云計算,到今天看是非常幸運的,因為這個(gè)領(lǐng)域里的技術(shù)有機會(huì )變成一項非常重要的產(chǎn)業(yè),而且這個(gè)產(chǎn)業(yè)還有很長(cháng)的生命周期,就像當年電氣化一樣。這既是云計算的幸運,也是計算的幸運。
5 原始創(chuàng )新更重要
不過(guò),一講到今天的人工智能和云計算,人們就會(huì )談到英偉達的A100 卡、H100 卡,很多人會(huì )覺(jué)得無(wú)卡就無(wú)能為力。參加CNCC2023 的有很多學(xué)生,王堅院士想對學(xué)生和科研人員說(shuō),所有的創(chuàng )新都是人創(chuàng )造的。例如GeForce 7800 卡( 圖8)。大概是2006 年的卡,它是第一個(gè)把CNN 算法跑在了GPU 卡上, 速度比CPU 快了4倍。但這張卡在當年是張什么卡?在中關(guān)村的所有網(wǎng)吧里都有,不是被禁運的,更不是只有少數人買(mǎi)得起的,因此是所有人能用的卡,但是,有人第一次把CNN 的算法跑起來(lái),為我們打開(kāi)了一個(gè)新天地。
圖8
這張卡就更加有意思了,6 年以后的2012 年,兩位來(lái)自多倫多大學(xué)的學(xué)生Alex Krizhevsky 和Ilya Sutskeverz(他們的導師是人工智能的三巨頭之一Geoffrey Hinton)就是用了兩張GeForce 7800 GPU 卡,在當年的ImageNet競賽上獲得了冠軍。
所以人們可以設想一下,憑借兩張當年每一個(gè)實(shí)驗室的學(xué)生都有的圖形卡,但是他們的智慧使得它能夠讓一個(gè)新的世界開(kāi)始。
GPU 能成為深度學(xué)習的必選項,而且被工業(yè)界最后采用,事實(shí)上是這兩個(gè)學(xué)生創(chuàng )造的。王堅院士是從工業(yè)界來(lái)的,有時(shí)候感到丟臉——是兩名學(xué)生為我們定義了今天人工智能應該用什么樣的框架來(lái)做。從這個(gè)角度看,學(xué)生的創(chuàng )造力是無(wú)窮的。
這兩名學(xué)生的第二人——Ilya Sutskeverz 也是今天OpenAI 的首席科學(xué)家。所以創(chuàng )新也不是一天就可以成就的。
從圖3 的架構演進(jìn)可以看到,在2004 年的技術(shù)架構基礎上完成了今天人們都趨之若鶩的一卡難求的狀況,可以看到原始創(chuàng )新的重要性。今天是我們可以重現2004 年那一代學(xué)生所創(chuàng )造出來(lái)的事情的時(shí)刻,所以所有的事情遠不是結束,而是剛剛開(kāi)始。
自AI 誕生后的幾十年中發(fā)生了很多事情,從1997年的Deep-Blue(深藍超級國際象棋電腦),到2016年的阿爾法狗,到今年的chatGPT,每一次重要發(fā)明都帶來(lái)一次變革,而且這種變革接下來(lái)因為計算的驅動(dòng)還會(huì )繼續地發(fā)生下去。所以慢慢地,到最后所謂的計算驅動(dòng),就是計算密集型、數據驅動(dòng)和基于模型的完美結合。
(本文來(lái)源于EEPW 2023年12月期)
評論