機器學(xué)習的崛起:從無(wú)人駕駛到AI醫療,人們已進(jìn)入深度學(xué)習的新世界
不久之前,人們還常說(shuō),計算機視覺(jué)的辨別能力尚不如一歲大的孩子。如今看來(lái),這句話(huà)要改寫(xiě)了。計算機不僅能和大多數成年人一樣識別圖片中的物體,在馬路上駕駛汽車(chē)的安全性還高過(guò)16 歲的青少年。更神奇的是,如今的計算機不再是被動(dòng)按照指令識別和駕駛,而是像自然界的生命由數百萬(wàn)年前開(kāi)始進(jìn)化那樣,自主地從經(jīng)驗中學(xué)習。是數據的井噴促成了這一技術(shù)進(jìn)步。如果說(shuō)數據是新時(shí)代的石油,那么學(xué)習算法就是從中提取信息的煉油廠(chǎng);信息積累成知識;知識深化成理解;理解演變?yōu)橹腔?。歡迎來(lái)到深度學(xué)習的新世界。
本文引用地址:http://dyxdggzs.com/article/201901/396937.htm深度學(xué)習是機器學(xué)習的一個(gè)分支,它根植于數學(xué)、計算機科學(xué)和神經(jīng)科學(xué)。深度網(wǎng)絡(luò )從數據中學(xué)習,就像嬰兒了解周?chē)澜缒菢?,從睜開(kāi)眼睛開(kāi)始,慢慢獲得駕馭新環(huán)境所需的技能。深度學(xué)習的起源可以追溯到20 世紀50 年代人工智能的誕生。關(guān)于如何構建人工智能。
當時(shí)存在兩種不同的觀(guān)點(diǎn):一種觀(guān)點(diǎn)主張基于邏輯和計算機程序,曾主宰人工智能的研究和應用數十年;另一種觀(guān)點(diǎn)則主張直接從數據中學(xué)習,經(jīng)歷了更長(cháng)時(shí)間的摸索才逐漸成熟。
20 世紀,計算機技術(shù)還不夠成熟,而且按照現在的標準,數據存儲成本十分高昂,用邏輯程序來(lái)解決問(wèn)題更加高效。熟練的程序員需要為每個(gè)不同的問(wèn)題編寫(xiě)不同的程序,問(wèn)題越大,相應的程序也就越復雜。如今,計算機能力日趨強大,數據資源也變得龐大且豐富,使用學(xué)習算法解決問(wèn)題比以前更快、更準確,也更高效。此外,同樣的學(xué)習算法還能用來(lái)解決許多不同的難題,這遠比為每個(gè)問(wèn)題編寫(xiě)不同的程序更加節省人力。
汽車(chē)新生態(tài):無(wú)人駕駛將全面走入人們生活
在2005 年美國國防部高級研究計劃局( 以下簡(jiǎn)稱(chēng)DARPA)舉辦的自動(dòng)駕駛挑戰賽中,一輛由斯坦福大學(xué)塞巴斯蒂安·特隆(Sebastian Thrun)實(shí)驗室開(kāi)發(fā)的自動(dòng)駕駛汽車(chē)Stanley最終贏(yíng)得了200萬(wàn)美元現金大獎。團隊利用了機器學(xué)習技術(shù)教它如何自主地在加利福尼亞州的沙漠中穿行。132 英里的賽道中有若干狹窄的隧道和急轉彎,還包括啤酒瓶道(Beer Bottle Pass),這是一段蜿蜒曲折的山路,兩側分別是碎石遍布的陡坡和斷壁。特隆并沒(méi)有遵循傳統的AI 方法,即通過(guò)編寫(xiě)計算機程序來(lái)應付各種偶發(fā)事件,而是在沙漠中駕駛Stanley,讓汽車(chē)根據視覺(jué)和距離傳感器的感應輸入,學(xué)習如何像人一樣駕駛。
特隆后來(lái)參與創(chuàng )立了高科技項目重點(diǎn)實(shí)驗室Google X,并開(kāi)始了進(jìn)一步研究自動(dòng)駕駛汽車(chē)技術(shù)的計劃。谷歌的自動(dòng)駕駛汽車(chē)自此開(kāi)始,在舊金山灣區累積了350 萬(wàn)英里的車(chē)程。優(yōu)步(Uber)已經(jīng)在匹茲堡投放了一批自動(dòng)駕駛汽車(chē)。蘋(píng)果也步入自動(dòng)駕駛領(lǐng)域,以擴大其操作系統控制的產(chǎn)品范圍,并希望能夠再現它在手機市場(chǎng)上的輝煌。汽車(chē)制造商們親眼看見(jiàn)一個(gè)100 年來(lái)從未改變的行業(yè)在他們眼前發(fā)生了轉型,也開(kāi)始奮起直追。通用汽車(chē)公司以10 億美元的價(jià)格并購了開(kāi)發(fā)無(wú)人駕駛技術(shù)的硅谷創(chuàng )業(yè)公司Cruise Automation,并在2017 年投入了額外的6 億美元用于研發(fā)。2017年,英特爾以153 億美元的價(jià)格收購了Mobileye,它是一家專(zhuān)門(mén)為自動(dòng)駕駛汽車(chē)研發(fā)傳感器和計算機視覺(jué)的公司。在價(jià)值數萬(wàn)億美元的交通運輸領(lǐng)域,參與的各方都下了極高的賭注。
自動(dòng)駕駛汽車(chē)不久將擾亂數百萬(wàn)卡車(chē)司機和出租車(chē)司機的生計。最終,如果一輛自動(dòng)駕駛汽車(chē)能夠在一分鐘內出現,將你安全帶到目的地且無(wú)須停車(chē),在城市擁有汽車(chē)就顯得不那么必要了。今天,汽車(chē)行駛時(shí)間平均僅占4%,這意味著(zhù)它其余96% 的時(shí)間都需要停放在某個(gè)地方。由于自動(dòng)駕駛汽車(chē)可以在城市外圍維修和停放,城市中被大量停車(chē)場(chǎng)占用的空間得以被重新高效利用。城市規劃者已經(jīng)開(kāi)始考慮讓停車(chē)場(chǎng)變成公園了。街邊的停車(chē)道可以成為真正的自行車(chē)道。其他汽車(chē)相關(guān)行業(yè)也將受到影響,包括汽車(chē)保險業(yè)和修理廠(chǎng)。超速和停車(chē)罰單將不復存在。由醉駕和疲勞駕駛導致的交通事故死亡人數也會(huì )相應減少。通勤浪費的時(shí)間也將被節省下來(lái)做其他事情。根據2014年的美國人口普查數據,1.39 億上班族人均單日通勤時(shí)間達到了52分鐘,全年總計296 億小時(shí)。這驚人的340 萬(wàn)年的時(shí)間本可以在人生中得到更好的利用。自動(dòng)駕駛汽車(chē)會(huì )使公路通行能力翻兩番。而且,一旦大規模投入使用,沒(méi)有方向盤(pán)、可以自己開(kāi)回家的自動(dòng)駕駛汽車(chē)還會(huì )讓大規模汽車(chē)盜竊行為銷(xiāo)聲匿跡。雖然目前自動(dòng)駕駛汽車(chē)仍面臨很多監管和法律層面的障礙,但這一技術(shù)一旦開(kāi)始普及,我們就將迎來(lái)一個(gè)嶄新的世界??梢灶A見(jiàn)的是,卡車(chē)大概會(huì )在10 年內率先實(shí)現自動(dòng)駕駛,出租車(chē)要花上15 年,而15 到25 年后,客運無(wú)人車(chē)將全面走入人們的生活。
汽車(chē)在人類(lèi)社會(huì )中的標志性地位將以我們無(wú)法想象的方式發(fā)生變化,一種新的汽車(chē)生態(tài)也將應運而生。正如100 多年前汽車(chē)的出現創(chuàng )造了許多新的行業(yè)和就業(yè)機會(huì ),圍繞著(zhù)自動(dòng)駕駛汽車(chē)的發(fā)展,也出現了一個(gè)快速增長(cháng)的生態(tài)系統。從谷歌獨立出來(lái)的自動(dòng)駕駛公司W(wǎng)aymo,8年來(lái)已經(jīng)投入了10億美元,并在加州中部山谷搭建了一個(gè)秘密測試場(chǎng)所。該場(chǎng)所位于一個(gè)占地91 英畝的仿造小鎮,其中還設計了騎自行車(chē)的“演員”和假的汽車(chē)事故。其目的是擴大訓練數據集以包含特殊和不常見(jiàn)的情況(也叫邊緣情況)。公路上罕見(jiàn)的駕駛事件經(jīng)常會(huì )導致事故。自動(dòng)駕駛汽車(chē)的不同之處就在于,當一輛汽車(chē)遇到罕見(jiàn)事件時(shí),相應的學(xué)習體驗會(huì )被傳遞給所有其他自動(dòng)駕駛汽車(chē),這是一種集體智能。其他自動(dòng)駕駛汽車(chē)公司也在建造許多類(lèi)似的測試設施。這些舉措創(chuàng )造了以前并不存在的新工作機會(huì ),以及用于汽車(chē)導航的傳感器和激光器的新供應鏈。
自然語(yǔ)言翻譯:從語(yǔ)言到句子的飛躍
如今,谷歌在超過(guò)100 種服務(wù)中使用了深度學(xué)習,包括街景視圖(Street View)、收件箱智能回復(Inbox Smart Reply)和語(yǔ)音搜索。幾年前,谷歌的工程師意識到他們需要將這些計算密集型應用擴展到云端。他們開(kāi)始著(zhù)手設計一種用于深度學(xué)習的專(zhuān)用芯片,并巧妙地設計了可以插入數據中心機架中的硬盤(pán)插槽的電路板。谷歌的張量處理單元(TPU)現在已配置在遍布全球的服務(wù)器上,讓深度學(xué)習應用程序的性能得到了大幅改進(jìn)。
深度學(xué)習快速改變格局的一個(gè)例子是它對語(yǔ)言翻譯的影響。語(yǔ)言翻譯是人工智能的一只圣杯,因為它依賴(lài)于理解句子的能力。谷歌最近推出了基于深度學(xué)習的最新版谷歌翻譯(Google Translate),代表了自然語(yǔ)言翻譯質(zhì)量的重大飛躍。幾乎一夜之間,語(yǔ)言翻譯就從零散雜亂的拼湊短語(yǔ),升級到了語(yǔ)意完整的句子。之前的計算機方法搜索的是可以被一并翻譯的詞匯組合,但深度學(xué)習會(huì )在整個(gè)句子中尋找詞匯之間的依賴(lài)關(guān)系。
下一步工作是訓練更大規模的深度學(xué)習網(wǎng)絡(luò ),針對段落來(lái)提高句子間的連貫性。文字背后都有悠久的文化歷史。俄裔作家和英文小說(shuō)家,《洛麗塔》一書(shū)的作者弗拉基米爾·納博科夫(Vladimir Nabokov)曾經(jīng)得出結論,在不同語(yǔ)言之間翻譯詩(shī)歌是不可能的。他將亞歷山大·普希金(Aleksandr Pushkin)的詩(shī)體小說(shuō)《葉甫蓋尼·奧涅金》(Eugene Onegin)直譯成了英文,并對這些詩(shī)文的文化背景做了解釋性腳注,以此論證他的觀(guān)點(diǎn)?;蛟S谷歌翻譯終有一天能夠通過(guò)整合莎士比亞的所有詩(shī)歌來(lái)翻譯他的作品。
評論