<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>
"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > 對話(huà) | 洪小文與陸堅共探AI與未來(lái)生活的美好愿景

對話(huà) | 洪小文與陸堅共探AI與未來(lái)生活的美好愿景

發(fā)布人:MSRAsia 時(shí)間:2021-09-20 來(lái)源:工程師 發(fā)布文章

編者按:科研,顧名思義,就是科學(xué)研究。小到生活用品,大到宇宙航天,生活中處處不缺由科學(xué)研究轉化而來(lái)的成果。而在科學(xué)研究的背后,是一群默默無(wú)聞、專(zhuān)心學(xué)術(shù)的科學(xué)家們。從科研小白到科研大佬的科研之旅,這背后的故事,你了解多少?

在 Ada Camp 2021 上,微軟亞洲研究院副院長(cháng)劉鐵巖博士,就“科學(xué)研究“這個(gè)話(huà)題結合自身科研之路,以及這一路以來(lái)的心得體會(huì ),為大家分享了科學(xué)研究到底該怎么做、想做好科研到底該具備哪些技能。希望即將走向或者正在進(jìn)行科研的你,能夠從這次講堂中收獲滿(mǎn)滿(mǎn),為自己的科研之路增添更多色彩!

1.jpg

微軟亞洲研究院副院長(cháng)劉鐵巖

非常榮幸參加“未來(lái)由妳 Ada Camp 2021”活動(dòng)。今天,我想結合一下自己的求學(xué)和工作經(jīng)歷,來(lái)跟大家分享一下我們應該如何去做科學(xué)研究,以及在做科研中可能遇到的問(wèn)題和疑惑,希望能給大家的科研生活帶來(lái)一定的幫助和啟發(fā)。

我本人的學(xué)術(shù)生涯非常簡(jiǎn)單,我是一個(gè)典型的科研工作者,如果用兩個(gè)數字來(lái)形容的話(huà),就是9和18 —— 9年的清華學(xué)習之旅和18年的微軟亞洲研究院工作之路。在過(guò)去的這27年里,我跟大家一樣,也是從一個(gè)懵懂的學(xué)生開(kāi)始,之后在學(xué)術(shù)之路上不斷攀登,一步一步取得了很多學(xué)術(shù)成果,逐漸被國際學(xué)術(shù)界所認可。

為什么我們要進(jìn)行科學(xué)研究?

其實(shí)原因非常簡(jiǎn)單,我們都知道科學(xué)技術(shù)是第一生產(chǎn)力,而科學(xué)研究則可以推動(dòng)和改變人類(lèi)的社會(huì ),塑造我們的未來(lái)。大家可能都非常熟悉人類(lèi)社會(huì )經(jīng)歷的4次工業(yè)革命,從機械化、電氣化到現在的信息化、智能化。我們的生產(chǎn)效率得到了極大的提升,生活質(zhì)量也有了巨大的改善。這4次工業(yè)革命的背后,都是科學(xué)技術(shù)的飛躍性發(fā)展,而這些技術(shù)的發(fā)明都離不開(kāi)幕后的英雄——默默無(wú)聞地從事著(zhù)科學(xué)研究的科學(xué)家們。

2.png

如果說(shuō)工業(yè)革命塑造了我們的昨天、今天,甚至是明天,那么自然科學(xué)的發(fā)展則更決定了我們人類(lèi)長(cháng)久的未來(lái)?!犊茖W(xué)(Science)》雜志在其125周年的時(shí)候刊發(fā)了一期專(zhuān)刊,列舉了關(guān)乎宇宙奧秘、生命機理以及人類(lèi)生存和可持續發(fā)展的125個(gè)最重要的現代科學(xué)問(wèn)題。每一個(gè)問(wèn)題都非常深刻,直擊靈魂。比如,宇宙是由什么構成的?意識的生物基礎是什么?人類(lèi)為什么只有那么少量的基因,卻有這么豐富的形態(tài)和這么高的智能?是否存在著(zhù)大一統的物理定律等等。

雖然這些問(wèn)題非常艱深,但是科學(xué)家們一直都沒(méi)有停止探索這些問(wèn)題的腳步,也不斷地通過(guò)自己的努力推進(jìn)著(zhù)人類(lèi)認識科學(xué)的邊界。

3.png

這其中很多的女性科學(xué)家也為我們人類(lèi)的發(fā)展做出了巨大的貢獻。比如,居里夫人、邁特納、埃利昂等等。當然還有我們中國的屠呦呦,因為發(fā)現了青蒿素,挽救了全球特別是發(fā)展中國家數百萬(wàn)人的生命。

4.png

可能有的同學(xué)會(huì )說(shuō),這些偉大的科學(xué)家離我們太偉大、太遙遠了,我們實(shí)在沒(méi)有勇氣成為他們那樣的人。的確,想要在科學(xué)領(lǐng)域成為有輝煌成就的科學(xué)家不是件容易的事情,不僅需要靠努力,而且還有一些運氣的成分。

不過(guò)今天我想告訴大家,邁進(jìn)科學(xué)的大門(mén)沒(méi)有那么難,也沒(méi)有那么遙遠。我相信不少同學(xué)兒時(shí)都有一個(gè)成為科學(xué)家的夢(mèng)想。而且我們每個(gè)人其實(shí)都有成為科學(xué)家的潛質(zhì),因為我們從孩提時(shí)就對周?chē)囊磺卸汲錆M(mǎn)了好奇心,對現實(shí)和虛幻的世界都充滿(mǎn)了想象力。而這兩點(diǎn)正是從事科學(xué)研究最最重要的特質(zhì)。

當然,科學(xué)家還需要更多的素質(zhì),比如,觀(guān)察敏銳,善于從細節中尋找到蛛絲馬跡,發(fā)現被別人忽略的線(xiàn)索;大膽假說(shuō),針對這些發(fā)現勇于提出自己的假設,能夠依據知識和直覺(jué),指出這些發(fā)現背后可能存在的重大規律;小心求證,假說(shuō)人人都可以提,但是只有被驗證了的假說(shuō)才是科學(xué)道理,這也是科學(xué)和迷信的分水嶺;嚴謹勤奮,無(wú)論是假說(shuō)還是求證,都要建立在大量的知識積累和嚴謹的推導之上;精確誠實(shí),科學(xué)是沒(méi)有捷徑的,造假、抄襲、敷衍的行為絕對不會(huì )造就真正的科學(xué)家;最后就是長(cháng)期堅持,科學(xué)之路不會(huì )一帆風(fēng)順。

5.png

我們經(jīng)常說(shuō),如果你做10個(gè)研究項目,有9個(gè)失敗了1個(gè)成功,這是正常規律。但是,如果你9個(gè)甚至10個(gè)都成功,那就說(shuō)明你選的研究題目太簡(jiǎn)單。所以我們必須要理解科學(xué)研究背后的規律,它不是一蹴而成的,甚至可能需要幾十年如一日的堅持,常常會(huì )大器晚成。

正是因為前面提到的這些原因,從事科學(xué)研究的人構成了一座金字塔。中國擁有博士學(xué)位的人數以百萬(wàn)計;在國際頂級會(huì )議或者期刊上發(fā)表過(guò)論文的中國學(xué)者可能只有幾萬(wàn)名;而國際知名的中國學(xué)者則更少,可能也就幾千人。從這個(gè)意義上講,“研究”其實(shí)是存在著(zhù)一定“風(fēng)險系數”的職業(yè)。我們需要一步一步攀登高峰,才能夠從獲得博士學(xué)位逐步成長(cháng)為一位國際知名的科學(xué)家。


什么是高質(zhì)量研究?

為了實(shí)現這個(gè)目的,我們首先要來(lái)看一看什么是好的科學(xué)研究,然后再探討如何能夠做出這樣的科學(xué)研究。

今天很多同學(xué)都是來(lái)自于計算機或者相關(guān)專(zhuān)業(yè)的,我們在這個(gè)行業(yè)里面是非常幸運的。因為計算機科學(xué)是發(fā)展最快的學(xué)科之一,它與國際接軌,影響面廣,關(guān)注度高,就業(yè)前景寬廣。

那么好的計算機研究到底是什么樣子的?不知道大家有沒(méi)有聽(tīng)過(guò)這樣一種對學(xué)者層次的生動(dòng)描述。

所謂一流學(xué)者,就是要去引領(lǐng)學(xué)術(shù)領(lǐng)域發(fā)展的,其可貴之處在于能夠洞察趨勢,提出重要問(wèn)題。二流學(xué)者,雖然沒(méi)有那么深的洞察力,但是有非常好的功底和知識技能,可以把別人提出的問(wèn)題解得很好,這對于學(xué)術(shù)研究也是一個(gè)非常重要的推動(dòng)力。而三流學(xué)者,通常是跟隨潮流、小步慢跑。雖然他們的工作可能沒(méi)有那么大的創(chuàng )新性,也沒(méi)有解決重大的科學(xué)問(wèn)題,但是他們也有很大的價(jià)值,因為他們試了很多錯,對學(xué)術(shù)界也做出了一定的貢獻。無(wú)論是哪種學(xué)者,我想大家內心里都希望能夠做出高質(zhì)量的研究。

到底什么是高質(zhì)量的研究呢?我認為高質(zhì)量的研究可以有很多種不同的類(lèi)型,它既可以是提出全新的重要問(wèn)題,也可以是首次解決一個(gè)公認的難題。這里舉幾個(gè)我自己的例子,讓大家有個(gè)形象的認識。

第一個(gè)例子,發(fā)生在大約15年前,那個(gè)時(shí)候搜索引擎剛剛興起,像 Google、百度這些公司都還是新興公司。在那個(gè)年代,搜索引擎背后的技術(shù)其實(shí)是比較落后的,很多人都是靠拍腦袋,想出一些經(jīng)驗的、啟發(fā)式的公式。針對這樣的情況,包括我在內的一些學(xué)者共同提出了一個(gè)科學(xué)問(wèn)題:我們能否用計算機自動(dòng)學(xué)習一個(gè)性能優(yōu)異的排序模型,而不是靠人為用啟發(fā)式去定義排序公式呢?

這個(gè)問(wèn)題后來(lái)就引出了一個(gè)新的學(xué)術(shù)分支,我們稱(chēng)之為 Learning to Rank(排序學(xué)習)。簡(jiǎn)而言之,就是利用機器學(xué)習的技術(shù),依據人為標注的正確答案,或者用戶(hù)在線(xiàn)與搜索引擎交互的點(diǎn)擊數據,學(xué)到針對特定的查詢(xún)詞,對網(wǎng)頁(yè)相關(guān)性進(jìn)行排序的一個(gè)最優(yōu)的模型。

6.png

在我們的倡導下,很多學(xué)者都加入了我們,一起在這些方面做了大量的研究。而所有這些學(xué)者的共同努力也成就了今天主流的商業(yè)搜索引擎,它們背后的技術(shù)幾乎無(wú)一不是排序學(xué)習,而排序學(xué)習就是典型的“提出重要問(wèn)題”的研究。

第二個(gè)例子,發(fā)生在大概五六年前,那時(shí)候人工智能的技術(shù)有著(zhù)突飛猛進(jìn)的發(fā)展,解決了很多實(shí)際的問(wèn)題。不過(guò),那時(shí)主流的機器學(xué)習技術(shù),需要大量人為標注的樣本。以機器翻譯為例,通常需要上千萬(wàn)的雙語(yǔ)語(yǔ)對來(lái)作為訓練數據,才能訓練出一個(gè)性能優(yōu)良的機器翻譯模型。然而,不是所有的人工智能任務(wù)都能夠獲得這樣豐富的數據。比如,很多小語(yǔ)種全世界可能會(huì )講這個(gè)語(yǔ)言的人都沒(méi)有幾個(gè),更不要說(shuō)找到人來(lái)標注大量的雙語(yǔ)數據了。在這個(gè)背景下,我們就提出了一個(gè)科學(xué)問(wèn)題:是否可以利用機器翻譯這類(lèi)人工智能任務(wù)的某種結構特點(diǎn),在不需要大量標注樣本,甚至不需要任何標注樣本的前提下,就能夠學(xué)到有效的人工智能模型?

這個(gè)問(wèn)題的提出并不是天方夜譚。我們注意到,類(lèi)似機器翻譯這樣的人工智能任務(wù),其實(shí)是一個(gè)雙向的交互任務(wù),比如中英翻譯的反向任務(wù)是英中翻譯,語(yǔ)音識別的反向任務(wù)是語(yǔ)音合成。一旦我們有了雙向的交互就可以形成一個(gè)閉環(huán)的信息流,而這種閉環(huán)就可能使得我們不需要任何人為標注,就能獲得驅動(dòng)機器學(xué)習模型訓練的信號,我們稱(chēng)這個(gè)技術(shù)范式為對偶學(xué)習。我們開(kāi)發(fā)了一系列對偶學(xué)習的技術(shù),在機器翻譯、圖像識別、語(yǔ)音合成等多個(gè)領(lǐng)域達到了世界上當時(shí)最好的效果,超越了人類(lèi)專(zhuān)家的水平。

另外,在新冠疫情肆虐全球的時(shí)候,我們利用新型的機器學(xué)習技術(shù),精確預測了病毒抗原到人類(lèi)免疫細胞之間的映射關(guān)系?;谶@個(gè)核心技術(shù),我們和合作伙伴一起完成了首個(gè)由 FDA 批準的基于人類(lèi)免疫細胞的早期新冠疾病的檢測系統,其安全性、準確性、及時(shí)性與常用的核酸檢測和抗體檢測相比都有明顯的優(yōu)勢。

除了前面提到的幾種高質(zhì)量研究以外,如果你通過(guò)自己的不懈努力,顯著(zhù)地超越了前人的工作,比如比前人工作的精度更高,比前人工作的速度更快,或者是在某些層面上比前人的工作具有了更深的洞察,那么恭喜你,你的研究也是一份質(zhì)量非常高的研究。

受時(shí)間所限,這里我就舉幾個(gè)速度顯著(zhù)超越前人工作的例子供大家參考。過(guò)去這幾年里,坊間流傳著(zhù)一種方法論,就是所謂的“大力出奇跡”。也就是使用大量的計算資源去訓練一個(gè)非常大的模型,用以解決現實(shí)中人類(lèi)可能只需要用非常小的努力就能解決的問(wèn)題。這種“大力出奇跡”的范式,從某種意義上講,有它的科學(xué)價(jià)值。但是它的實(shí)用性是值得質(zhì)疑的,因為我們不可能為了翻譯一句話(huà),使用幾百美金、幾千美金的成本。

心懷對“大力出奇跡”的質(zhì)疑,我們微軟亞洲研究院的研究員們從事了一系列“四兩撥千斤”的研究,比如2015年我們的團隊發(fā)明了 LightLDA,這是當時(shí)世界上速度最快、效率最高的主題模型。所謂主題模型,就是從文本數據中自動(dòng)分析主題的一種算法。我們通過(guò)一項新技術(shù)把每個(gè)文本符號的采樣復雜度降到了O(1),也就是和想要學(xué)出的主題的數目無(wú)關(guān)。在 LightLDA 出現之前,全球最大規模的主題模型用了1萬(wàn)個(gè) CPU 核,挖掘出了大約10萬(wàn)個(gè)主題。而我們的 LightLDA 只需要300多個(gè) CPU 核就可以挖掘出一百萬(wàn)個(gè)主題,并且可以處理的文本數據的大小也比前人的大一個(gè)數量級。之后,我們還陸續提出了 LightGBM,比之前最快的梯度提升決策樹(shù)的算法快了將近10倍,FastSpeech 比之前最快的神經(jīng)語(yǔ)音合成模型快了300倍,以及 FastBERT 比知名的預訓練語(yǔ)言模型 BERT 快了大概10倍,而且所有這些模型的精度都幾乎沒(méi)有損失。

7.png

通過(guò)這些研究,我們把之前最好的算法的速度提高了一個(gè)到幾個(gè)數量級,幫助人們節省了大量的計算成本,從而大大提升了這些技術(shù)的實(shí)用價(jià)值。從這個(gè)意義上講,它們也是高質(zhì)量的研究。


如何能夠勇攀科研高峰?

剛剛我用了一些典型的例子給大家展示了什么是高質(zhì)量的研究,那么如何才能做出這樣的研究呢?今天我想跟大家分享一些科學(xué)研究的原則和思想。我覺(jué)得這些可能對于引導大家走上科研道路,真正有勇氣去攀登學(xué)術(shù)高峰,會(huì )很有幫助。

在去年諾貝爾獎官方平臺發(fā)布的一個(gè)視頻*中,幾位諾貝爾獎獲得者與年輕學(xué)者分享了幾個(gè)重要的做研究的原則,包括:Work Hard(努力),Learning by doing(邊做邊學(xué)),以及 do something you love(做你喜歡的事情)。(*感興趣的讀者,可點(diǎn)擊鏈接觀(guān)看:https://www.youtube.com/watch?v=9GIsSn_LUh0)除了這些以外,我還為大家總結了以下幾點(diǎn)。

第一、終身學(xué)習,是學(xué)者的宿命?;仡櫸易约?0多年的研究歷程,從最初的信號處理、視頻內容分析、網(wǎng)絡(luò )搜索、機器學(xué)習、算法博弈論、深度學(xué)習、強化學(xué)習、金融、物流、生物、制****、智能科學(xué),一路走來(lái)沒(méi)有停止過(guò)學(xué)習。在這個(gè)過(guò)程中,自己變得越來(lái)越博學(xué)、越來(lái)越豐富,對世界的影響也越來(lái)越大。所以我建議所有的同學(xué)們多學(xué)習、多了解,不要放棄學(xué)習的腳步。

第二、研究很苦,有很多的困難,具有好奇心、熱情甚至信仰,才是驅動(dòng)我們、支撐我們在研究道路上不斷前行的動(dòng)力。我給大家舉一個(gè)例子,我們研究組在過(guò)去的兩三年時(shí)間里,逐漸對計算生物學(xué)有了濃厚的興趣,并且投入了很多的精力和資源。在這些方面的探索與我們的好奇心密切相關(guān),因為我們發(fā)現生物領(lǐng)域有趣且深奧。比如微生物菌群,大家可能想象不到,你體內的微生物比你自己的細胞還多,我們從某種意義上講是被這些微生物控制的,我們愛(ài)吃什么、我們的生活習慣、我們的健康狀況,都與這些微生物息息相關(guān)。所以我們想要做到真正的精準醫療,必須對這些微生物有深入的了解。另一個(gè)例子是表觀(guān)遺傳,我們每個(gè)細胞里的基因都是相同的,可是有些細胞最終發(fā)展成了我們的皮膚,有些發(fā)展成了我們的大腦,有些變成了內臟。是誰(shuí)對基因表達進(jìn)行了如此神奇的調控呢?正是基于對這些問(wèn)題的好奇心,我們在三年前成立了計算生物學(xué)組,并且在這些方向上取得了非常令人鼓舞的成果。

第三、研究對創(chuàng )新有著(zhù)非常高的要求,這件事情說(shuō)起來(lái)容易,做起來(lái)卻很難。我發(fā)現很多同學(xué)特別愿意在自己的“小盒子”里面,如果你想要跳出這個(gè)小盒子,那么就必須要知道外面的世界是什么樣子的,這與我們前面提到的終身學(xué)習密切相關(guān)。當你有了深入的研究,同時(shí)有了寬闊的視野時(shí),你通常會(huì )做出可以讓別人非常驚訝的研究成果。

第四、質(zhì)重于量,精益求精。因為我們每個(gè)人的時(shí)間和精力是非常有限的,要學(xué)會(huì )合理分配。我們可以用同樣的時(shí)間做100項不同的研究,每一項都淺嘗輒止;也可以集中盡力做一件事,非常深入,取得世界矚目的成績(jì)。

最后,我想要鼓勵大家不怕失敗。人不可能不犯錯,不可能沒(méi)有失敗,只要我們能夠從失敗中學(xué)習,其實(shí)失敗會(huì )給你提供更多的經(jīng)驗,讓你能夠把事情做得更好。

科學(xué)研究是很神圣的,但是科學(xué)研究的道路并不是高不可攀的。我們只要有正確的動(dòng)機,有效的方法論,完全可以在科研道路上不斷地創(chuàng )造成功,不斷做出自己的貢獻。

*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。

高通濾波器相關(guān)文章:高通濾波器原理


關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>