自動(dòng)駕駛領(lǐng)頭羊Waymo十周年奉獻:Auto ML機器學(xué)習
美國當地時(shí)間1月16日,全球自動(dòng)駕駛領(lǐng)頭羊Waymo,發(fā)布了十年周年慶祝短視頻,并且在官方博客上發(fā)布了關(guān)于“Auto ML(Auto Machine Learning)”的文章,深度剖析了Auto ML與Google AI大腦,是如何幫助Waymo發(fā)展自動(dòng)駕駛技術(shù)的。
本文引用地址:http://dyxdggzs.com/article/201901/396880.htm在Waymo的官方推特上寫(xiě)著(zhù):十年前的這個(gè)星期,“項目司機”正式成立,其使命是改善道路安全,使交通更加便利。從這個(gè)“登月”項目,到谷歌自動(dòng)駕駛汽車(chē)項目,現在是Waymo,一起為下一個(gè)十年及更遠的將來(lái)而努力!
下面是關(guān)于A(yíng)uto ML的文章,在Waymo,機器學(xué)習幾乎在自動(dòng)駕駛系統的每個(gè)部分都扮演著(zhù)關(guān)鍵角色。它幫助我們的汽車(chē)看清周?chē)沫h(huán)境,理解世界,預測他人的行為,并決定他們下一步的最佳行動(dòng)。
以感知為例,Waymo的系統采用了神經(jīng)網(wǎng)絡(luò )的組合,使Waymo的車(chē)輛能夠解讀傳感器數據、識別物體,并隨著(zhù)時(shí)間的推移跟蹤它們,從而對周?chē)氖澜缬幸粋€(gè)深入的了解。
創(chuàng )建這些神經(jīng)網(wǎng)絡(luò )通常是一項耗時(shí)的任務(wù):優(yōu)化神經(jīng)網(wǎng)絡(luò )架構,以達到自動(dòng)駕駛汽車(chē)運行所需的質(zhì)量和速度,是一個(gè)復雜的微調過(guò)程,Waymo工程師可能需要數月時(shí)間來(lái)完成一項新任務(wù)。
現在,通過(guò)與來(lái)自Google AI大腦的研究人員合作,Waymo正在將前沿研究付諸實(shí)踐,以自動(dòng)生成神經(jīng)網(wǎng)絡(luò )。更重要的是,這些最先進(jìn)的神經(jīng)網(wǎng)絡(luò )比那些由工程師手工調整的神經(jīng)網(wǎng)絡(luò )質(zhì)量更高、速度更快。
為了將Waymo的自動(dòng)駕駛技術(shù)應用到不同的城市和環(huán)境中,需要針對不同的場(chǎng)景快速優(yōu)化Waymo的模型。Auto ML使Waymo能夠做到這一點(diǎn),高效和連續地提供大量ML解決方案。

01 遷移學(xué)習:使用現有的自動(dòng)化架構
Waymo和Google AI大腦的合作始于一個(gè)簡(jiǎn)單的問(wèn)題:Auto ML能否為汽車(chē)生成高質(zhì)量、低延遲的神經(jīng)網(wǎng)絡(luò )?
質(zhì)量衡量的標準是由神經(jīng)網(wǎng)絡(luò )產(chǎn)生的答案的準確性,延遲度量網(wǎng)絡(luò )提供答案的速度,也稱(chēng)為推理時(shí)間。由于駕駛是一種活動(dòng),它要求車(chē)輛使用實(shí)時(shí)答案,并且考慮到系統的安全性,神經(jīng)網(wǎng)絡(luò )需要在低延遲的情況下運行。大多數網(wǎng)絡(luò )直接運行在Waymo的車(chē)輛上,結果少于10毫秒,這比部署在數千臺服務(wù)器上的數據中心中的許多網(wǎng)絡(luò )要快。
在原來(lái)的Auto ML論文(Learning Transferable Architectures for Scalable ImageRecognition PDF,獲取方式見(jiàn)文末),谷歌AI的員工能夠自動(dòng)探索12000多個(gè)架構解決CIFAR-10的經(jīng)典圖像識別任務(wù):確定一個(gè)小形象代表十個(gè)類(lèi)別之一,比如買(mǎi)一輛汽車(chē)、飛機、一只狗,等等。
在后續文章(NEURAL ARCHITECTURE SEARCH WITHREINFORCEMENT LEARNING
PDF,獲取方式見(jiàn)文末),他們發(fā)現了一個(gè)家庭的神經(jīng)網(wǎng)絡(luò )的構建塊,稱(chēng)為NAS單元,這可能是由自動(dòng)構建比手工網(wǎng)CIFAR-10和類(lèi)似的任務(wù)。通過(guò)這種合作,Waymo的研究人員決定使用這些單元來(lái)自動(dòng)構建針對自動(dòng)駕駛任務(wù)的新模型,從而將CIFAR-10上的知識轉移到汽車(chē)領(lǐng)域,第一個(gè)實(shí)驗是語(yǔ)義分割任務(wù):識別激光雷達點(diǎn)云中的每個(gè)點(diǎn),如汽車(chē)、行人、樹(shù)等。

圖一:一個(gè)NAS單元的例子,這個(gè)單元在神經(jīng)網(wǎng)絡(luò )中處理前兩層的輸入
為此,Waymo研究人員建立了一個(gè)自動(dòng)搜索算法,在卷積網(wǎng)絡(luò )架構(CNN)中探索數百種不同的NAS單元組合,為Waymo的激光雷達分割任務(wù)訓練和評估模型。當Waymo的工程師手工調整這些網(wǎng)絡(luò )時(shí),只能探索有限數量的架構,但是使用這種方法,可以自動(dòng)探索了數百個(gè)架構。
相比以前的人工微調優(yōu)化神經(jīng)網(wǎng)絡(luò ),Auto ML通過(guò)下面兩種方式來(lái)改進(jìn):
一些具有類(lèi)似質(zhì)量的延遲顯著(zhù)降低;
其他的則具有更高的質(zhì)量和類(lèi)似的延遲。
初步成功后,Waymo將相同的搜索算法應用于另外兩個(gè)與交通車(chē)道檢測和定位相關(guān)的任務(wù),轉移學(xué)習技術(shù)也適用于這些任務(wù),最后能夠在汽車(chē)上部署三個(gè)新訓練和改進(jìn)的神經(jīng)網(wǎng)絡(luò )。

十年前的Waymo自動(dòng)駕駛汽車(chē)(普銳斯)
02 端到端搜索:從頭開(kāi)始搜索新的架構
被最初成功的結果所鼓舞,接著(zhù)就是更進(jìn)一步、更廣泛地尋找能夠提供更好結果的全新架構,通過(guò)不局限于組合已經(jīng)發(fā)現的NAS單元,可以更直接地尋找考慮到嚴格的延遲需求的架構。
執行端到端搜索通常需要手動(dòng)探索數千個(gè)架構,這需要大量的計算成本。探索單一架構需要在具有多個(gè)GPU卡的數據中心計算機上進(jìn)行幾天的培訓,這意味著(zhù)搜索單個(gè)任務(wù)需要數千天的計算時(shí)間。相反,通過(guò)設計了一個(gè)代理任務(wù):一個(gè)縮小的激光雷達分割任務(wù),可以在幾個(gè)小時(shí)內解決。
Waymo團隊必須克服的一個(gè)挑戰,是找到一個(gè)與最初的細分任務(wù)足夠相似的代理任務(wù)。在確定代理任務(wù)上的架構質(zhì)量與原始任務(wù)上的架構質(zhì)量之間的良好相關(guān)性之前,對幾個(gè)代理任務(wù)設計進(jìn)行了試驗。然后,啟動(dòng)了一個(gè)類(lèi)似于A(yíng)utoML論文的搜索,但現在是代理任務(wù):一個(gè)端到端代理搜索。這是這個(gè)概念第一次應用在激光雷達數據上。

圖二:代理端到端搜索:在一個(gè)縮小的代理任務(wù)上探索數千個(gè)架構,將100個(gè)最佳架構應用于原始任務(wù),驗證和部署car上最好架構中的最好架構
Waymo使用了幾種搜索算法,對質(zhì)量和延遲進(jìn)行優(yōu)化,因為這對車(chē)輛非常重要。觀(guān)察不同類(lèi)型的CNN架構,使用不同的搜索策略,如隨機搜索和強化學(xué)習,能夠為代理任務(wù)探索超過(guò)10,000種不同的架構。通過(guò)使用代理任務(wù),在谷歌TPU集群上需要一年以上計算時(shí)間的任務(wù)只需要兩周時(shí)間。
當我們剛剛轉移了NAS單元,結果發(fā)現了比以前更好的網(wǎng)絡(luò ):
在相同的質(zhì)量下,神經(jīng)網(wǎng)絡(luò )的延遲降低20-30%;
具有更高質(zhì)量的神經(jīng)網(wǎng)絡(luò ),錯誤率降低8-10%,與以前的架構具有相同的延遲。

圖三 :1)第一個(gè)圖展示了在一組簡(jiǎn)單的架構上隨機搜索發(fā)現的大約4000個(gè)架構。每個(gè)點(diǎn)都是一個(gè)經(jīng)過(guò)培訓和評估的架構。實(shí)線(xiàn)表示不同推理時(shí)間約束下的最佳體系結構,紅點(diǎn)表示用轉移學(xué)習構建的網(wǎng)絡(luò )的延遲和性能。在這種隨機搜索中,網(wǎng)絡(luò )學(xué)習效果不如遷移學(xué)習

圖三:2)在第二張圖中,黃色和藍色的點(diǎn)表示另外兩種搜索算法的結果。黃色的是對一組精致架構的隨機搜索。藍色的那個(gè)使用了強化學(xué)習,就像在[1]中一樣,探索了6000多個(gè)架構。它產(chǎn)生了最好的結果。這兩個(gè)額外的搜索發(fā)現,網(wǎng)絡(luò )明顯優(yōu)于遷移學(xué)習的網(wǎng)絡(luò )
在搜索中發(fā)現的一些架構顯示了卷積、池化和反卷積操作的創(chuàng )造性組合,如下圖所示。這些架構最終非常適合最初的激光雷達分割任務(wù),并將部署在Waymo的自動(dòng)駕駛汽車(chē)上。

圖四:由代理端到端搜索發(fā)現的一種神經(jīng)網(wǎng)絡(luò )結構
03 接下來(lái)是什么
Waymo的Auto ML實(shí)驗僅僅是個(gè)開(kāi)始。對于激光雷達分割任務(wù),傳輸學(xué)習和代理端到端搜索都提供了比人工制作更好的網(wǎng)絡(luò ),現在有機會(huì )將這些機制應用到新的任務(wù)類(lèi)型上,這可以改善許多其他的神經(jīng)網(wǎng)絡(luò )。
這一發(fā)展為未來(lái)的ML工作開(kāi)辟了新的令人興奮的道路,并將提高Waymo的自動(dòng)駕駛技術(shù)的性能和能力,并繼續與谷歌AI大腦的合作。
評論