人工智能的進(jìn)展及發(fā)展建議
作者/ 王瑩 《電子產(chǎn)品世界》編輯
本文引用地址:http://dyxdggzs.com/article/201702/344562.htm摘要:2017年1月12日,清華大學(xué)計算機系教授鄧志東在“科學(xué)傳播與科技期刊論壇暨刊媒惠年度大會(huì )”上,做了《擁抱人工智能的春天》的報告。介紹了四個(gè)方面:2016年人工智能迎來(lái)了春天,人工智能引起社會(huì )的極大關(guān)注,人工智能上升為國家發(fā)展戰略,發(fā)展我國人工智能技術(shù)與產(chǎn)業(yè)的建議。
1 2016年人工智能迎來(lái)了春天
2016年人工智能(AI)進(jìn)入了第三個(gè)高潮。2016年3月9~15日,谷歌AlphaGo(阿爾法狗)以4:1的成績(jì)擊敗世界圍棋冠軍李世石職業(yè)九段,意義非常重大。因為過(guò)去機器主要做感知,現在出現了認知,這是人工智能的關(guān)鍵所在。
8個(gè)月后,2016年12月29日~2017年1月4日,AlphaGo的升級版——谷歌Master(大師)在30秒快棋網(wǎng)測中,以60勝0負1和的成績(jì),橫掃柯潔、古力、聶衛平、樸廷桓、井山裕太等數十位中日韓世界冠軍與頂級高手。從此以后,也許人類(lèi)以后就沒(méi)有和Master進(jìn)行圍棋比賽的機會(huì )了!除了圍棋,人工智能下一步將在國際象棋、中國象棋等棋類(lèi)方面發(fā)展。
撲克牌方面,專(zhuān)家水平的人工智能首次戰勝一對一無(wú)限注德州撲克人類(lèi)職業(yè)玩家,而且DeepStack讓機器擁有知覺(jué)。
人工智能還能玩游戲。其意義很重大,平時(shí)環(huán)境中很難得到一些數據,因為游戲相當于虛擬社會(huì ),例如“星際爭霸2”是復雜的虛擬社會(huì ),如果人工智能在這個(gè)虛擬社會(huì )中能戰勝人,這將是非常了不起的,未來(lái)可涉及到高級決策,在軍事上很有用處。2016年11月5日,谷歌DeepMind宣布與暴雪合作開(kāi)發(fā)人工智能,挑戰實(shí)時(shí)戰略視頻游戲“星際爭霸2”。這件事情的意義非常重大。下一步可以用于軍事上的高級戰略決策。
無(wú)人駕駛方面,2016年11月15日,“在第三屆世界互聯(lián)網(wǎng)大會(huì )”期間,18輛百度“云驍”亮相烏鎮子夜路,在3.16公里的開(kāi)放城區道路上自主行駛。2016年特斯拉Autopilot 2.0問(wèn)世,該軟件只需要八千美元,就可讓軟件駕駛汽車(chē)。所有特斯拉新車(chē)將安裝“具有完全自動(dòng)駕駛功能”的該硬件系統,并可通過(guò)OTA(空中下載技術(shù))進(jìn)行軟件升級;自動(dòng)駕駛功能從L2(二級,半無(wú)人駕駛)直接跳躍到L4/L5();2017年底之前,特斯拉車(chē)將以完全自動(dòng)駕駛模式從洛杉磯開(kāi)往紐約。Uber提出在城區大范圍無(wú)人駕駛出租車(chē)試運行,Uber 2016年9月14日在美國匹茲堡市推出城區大范圍無(wú)人駕駛出租車(chē)免費載客服務(wù)并試運行,先期已測試近2年,說(shuō)明無(wú)人駕駛真正落地了。
為何無(wú)人駕駛很重要?因為人工智能是無(wú)人駕駛的核心。除了百度、特斯拉、Uber,谷歌Waymo也在做自動(dòng)駕駛測試。此外,沃爾沃、福特、寶馬、百度、英特爾等全球約20多家企業(yè)公開(kāi)宣布,4年以后的2021年將會(huì )是無(wú)人駕駛/自動(dòng)駕駛元年,部分SAE L4車(chē)將會(huì )實(shí)現量產(chǎn)。
*計算機視覺(jué)
針對ImageNet ILSVRC測試比賽的1000種物體識別,Deep CNN超過(guò)了人類(lèi)的識別能力。人是5.1%(如圖1),2016年2月23日谷歌人工識別的評測是3.08%。ImageNet ILSVRC中有1000種物體,例如猴子、馬、飛機、坦克等約1500萬(wàn)張照片、包含2.2萬(wàn)類(lèi)種不同物體。深度學(xué)習一般能做到52層,極深度學(xué)習(very deep learning)現在已經(jīng)做到1000層。
在ILSVRC 2016國際評測中,包括視覺(jué)物體檢測、視覺(jué)物體定位、視頻物體檢測、場(chǎng)景分類(lèi)、場(chǎng)景解析等性能均有提高。值得一提的是,在此次大會(huì )上,中國團隊大放異彩,幾乎包攬了各個(gè)項目的冠軍(圖2)。
*人工智能語(yǔ)義分割
基于全卷積神經(jīng)網(wǎng)絡(luò )FCN的路面/場(chǎng)景像素級語(yǔ)義分割取得重要進(jìn)展。為此,我們可以分割大部分道路。
*人工智能唇語(yǔ)專(zhuān)家
看電視時(shí)把聲音關(guān)掉,靠嘴唇說(shuō)話(huà)的變化來(lái)識別談話(huà)內容,這種能力機器識別率已經(jīng)超過(guò)人類(lèi)。例如2016年12月,英國牛津大學(xué)與谷歌DeepMind等研發(fā)的自動(dòng)唇讀系統LipNet,對GRID語(yǔ)料庫實(shí)現了95.2%的準確率;對BBC電視節目嘉賓進(jìn)行唇語(yǔ)解讀,準確率為46.8%,遠遠超過(guò)專(zhuān)業(yè)的人類(lèi)唇語(yǔ)專(zhuān)家(僅為12.4%)。
*人工智能人臉識別
人臉識別可以達到產(chǎn)品級別,例如支付寶的刷臉成功率超過(guò)了人類(lèi)。如圖3,人的水平為97.46,百度為99.77。因此可以進(jìn)行產(chǎn)品體驗。2017年1月6日,百度人工智能機器人“小度”利用其超強人類(lèi)識別能力,以3:2險勝人類(lèi)最強大腦代表王峰。
*語(yǔ)音識別
目前的社交新媒體和互動(dòng)平臺中,AI虛擬助手和AI聊天機器人正在崛起。一天,美國GIT(佐治亞理工大學(xué))的一個(gè)課堂上來(lái)了一位助教,教師講完課后說(shuō):“大家有問(wèn)題就問(wèn)助教吧”。這位助教原來(lái)是個(gè)會(huì )眨眼睛的機器人!這時(shí)學(xué)生們才知道每天網(wǎng)上給他們答疑解惑的是人工智能,此前學(xué)生們也感到很吃驚,這位助教非常敬業(yè),晚上還在發(fā)Email。
*人工智能語(yǔ)音合成
指從文本聲音到真實(shí)聲音,可以自動(dòng)翻譯成英文。2016年9月19日,谷歌DeepMind推出WaveNet,實(shí)現文本到美式英語(yǔ)或中國普通話(huà)的真實(shí)感語(yǔ)音合成。
*人工智能速記員
包括語(yǔ)音識別和NLP(自然語(yǔ)言處理)。2016年10月17日,微軟的語(yǔ)音識別系統實(shí)現了5.9%的詞錯率(WER),媲美人類(lèi)專(zhuān)業(yè)速記員,且錯誤率更低;中國科大訊飛也有語(yǔ)音輸入法。
*人工智能翻譯
中國人往往從小學(xué)到讀博士都在學(xué)英語(yǔ)?,F在,谷歌、微軟和百度等公司在做人工智能翻譯。以谷歌為例,2016年9月27日,谷歌的神經(jīng)機器翻譯系統(GNMT)實(shí)現了多語(yǔ)種翻譯,較之傳統方法,英譯西班牙翻譯錯誤率下降了87%,英譯漢下降了58%,漢譯英下降了60%,已接近人工翻譯的水平。也許今后學(xué)外語(yǔ)沒(méi)那么重要了,人們可戴著(zhù)耳機,耳機能直接翻譯成各國語(yǔ)言。
*人工智能對抗訓練
Goodfellow(2014)提出的生成式對抗網(wǎng)絡(luò )(GAN),為半監督學(xué)習/舉一反三式的學(xué)習發(fā)展提供新思路,2016年發(fā)展迅速。目前是監督式學(xué)習,需要依靠大數據,因此大數據需要非常完備。而人是舉一反三式的學(xué)習。例如人沒(méi)有見(jiàn)過(guò)飛機,看過(guò)幾張照片就可以把世界上所有飛機都認出;目前的大數據驅動(dòng)的深度學(xué)習方式,是把世界上所有飛機照片都看過(guò)才行?,F在進(jìn)行舉一反三的半監督或無(wú)監督式學(xué)習,思路是采用對抗的方法,一個(gè)網(wǎng)絡(luò )造假,另一網(wǎng)絡(luò )鑒別照片是真是假,通過(guò)對抗式的學(xué)習來(lái)共同進(jìn)步(如圖4)。
*人工智能引擎
芯片三巨頭——英特爾、英偉達和高通全部轉到了人工智能上。為此英偉達的股票漲了幾倍。英特爾也在大搞人工智能。高通為了進(jìn)入人工智能領(lǐng)域,收購了恩智浦,恩智浦此前收購了飛思卡爾。
現在出現了基于超級GPU/TPU集群的離線(xiàn)訓練,采用超級GPU/TPU集群服務(wù)器,例如英偉達的深度學(xué)習芯片Tesla P100及DGX-1深度學(xué)習計算機,谷歌數據中心的TPU。
終端應用采用GPU/FPGA-based DPU,例如英特爾Apollo Lake A3900的“智能互聯(lián)駕駛艙平臺”,高通驍龍的820A處理器。
*通用人工智能與認知智能
1997年,IBM的超級電腦程序“深藍”擊敗國際象棋大師加里?卡斯帕羅夫;2011年2月,IBM的自動(dòng)問(wèn)答系統在美國最受歡迎的智力競答電視節目“危險邊緣”中戰勝了人類(lèi)冠軍;IBM的沃森醫生在某些細分疾病領(lǐng)域已能提供頂級醫生的醫療診斷水平,例如胃癌診斷。
可見(jiàn),1.AlphaGo和Master等已可橫掃人類(lèi)圍棋職業(yè)頂尖高手,下一步,將能下中國象棋等所有棋類(lèi),此外還可以打牌、炒股等,即什么都可以干,是強人工智能。2.人工智能已成為無(wú)人駕駛汽車(chē)商業(yè)落地的關(guān)鍵。3.視覺(jué)物體識別、人臉識別、唇語(yǔ)識別等在許多國際公開(kāi)評測中,達到或超過(guò)人類(lèi)的水平;4.速記等語(yǔ)音識別已可媲美人類(lèi);5.包括神經(jīng)機器翻譯在內的自然語(yǔ)言處理,性能也大幅度提升;6.生成式對抗網(wǎng)絡(luò )得到極大關(guān)注。
目前,發(fā)展通用人工智能成為普遍共識。
2 社會(huì )極大關(guān)注
未來(lái),可能很多工作就會(huì )消失了。
人工智能引起社會(huì )的極大關(guān)注和熱議,人工智能發(fā)展很快;而且人工智能的學(xué)習速度快,很勤奮,未來(lái)可以達到人類(lèi)所有的智能,這時(shí)到達了從強人工智能到超越人工智能的奇點(diǎn);人工智能有超越人類(lèi)智能的可能;理論上,人工智能還可以永生。
這也引起了很多人們的擔憂(yōu)。奇點(diǎn)到來(lái)、強人工智能、超人工智能、意識永生、人類(lèi)滅絕等聳人聽(tīng)聞的觀(guān)點(diǎn)出現,引起包括霍金、蓋茨和馬斯克等在內的世界名人對人工智能發(fā)展的擔憂(yōu)。在每年的世界人工智能大會(huì )上,專(zhuān)門(mén)有一個(gè)論壇探討人工智能與法律、倫理及人類(lèi)未來(lái)的會(huì )場(chǎng)。
現在,人工智能工業(yè)的OpenAI成立。
2016年全社會(huì )對人工智能的極大關(guān)注,可能是2016年AI的最大進(jìn)展!
在半監督/無(wú)監督學(xué)習、通用人工智能方面,人工智能具有舉一反三,并有常識、經(jīng)驗、記憶、知識學(xué)習、推理、規劃、決策,甚至還有動(dòng)機。這最后一點(diǎn)有點(diǎn)恐怖,人是有意識和動(dòng)機的,機器做事也有動(dòng)機,太可怕了。
智能學(xué)習進(jìn)步很快,Alpha Go八個(gè)月后就可以戰勝所有圍棋手,因為它能每天24小時(shí)學(xué)習、不吃不喝地學(xué)習,比人強多了。
因此,在經(jīng)歷了60年“三起兩落”的發(fā)展后,以深度學(xué)習為主要標志的人工智能正迎來(lái)第3次偉大復興,這次引起社會(huì )尤其是產(chǎn)業(yè)界高強度的關(guān)注。因為上世紀60年代和80年代,人工智能沒(méi)有達到這樣的水平。
硅谷精神教父、預言家凱文?凱利說(shuō),未來(lái)人工智能會(huì )成為一種如同電力一樣的基礎服務(wù)。斯坦福大學(xué)推出了“人工智能百年研究”首份報告——《2030年的人工智能與生活》。
3 人工智能上升為國家發(fā)展戰略
有人認為第四次工業(yè)革命即將由人工智能與機器人等引爆。英國政府認為,人工智能有望像19世紀的蒸汽機革命那樣徹底改變我們的生活,甚至人工智能給人類(lèi)社會(huì )帶來(lái)的變革與影響,有可能遠遠超過(guò)蒸汽機、電力和互聯(lián)網(wǎng)帶來(lái)的前三次工業(yè)革命。
智能制造、無(wú)人駕駛汽車(chē)、消費類(lèi)智能機器人、虛擬助手、聊天機器人、智能金融、智能醫療、智能新聞寫(xiě)作、智能律師、智慧城市等可能被人工智能代替。人工智能將無(wú)處不在,可望替換人類(lèi)的部分腦力勞動(dòng),一些職業(yè)會(huì )被取代或補充,一些新的行業(yè)又會(huì )誕生,例如18世紀出現了紡織工人,之后汽車(chē)代替了馬車(chē)等。因此,我們將經(jīng)歷從“互聯(lián)網(wǎng)+”到“人工智能+”。
中國“互聯(lián)網(wǎng)+”與“中國制造2025”國家發(fā)展戰略的實(shí)施,對人工智能的巨大需求在迅速增長(cháng)。未來(lái)2~5年,人工智能應用與產(chǎn)業(yè)發(fā)展將迎來(lái)爆發(fā)期。
中國政府在《“互聯(lián)網(wǎng)+”人工智能3年行動(dòng)實(shí)施方案》提出:計劃在2018年形成千億級人工智能產(chǎn)業(yè)應用規模。2017年1月10日,科技部部長(cháng)萬(wàn)鋼稱(chēng),將編制完成人工智能專(zhuān)項規劃,加快推進(jìn)人工智能等重大項目的立項論證。
美國政府在2016年10月13日出臺了《為人工智能的未來(lái)做好準備》的報告,提出了23條建議措施。同一天,美國政府又出臺了《國家人工智能研發(fā)戰略規劃》,提出了7大重點(diǎn)戰略方向。美國參議院于2016年11月30日召開(kāi)了關(guān)于人工智能的首次國會(huì )聽(tīng)證會(huì ),主題是“人工智能的黎明”,認為中國是對美國人工智能全球領(lǐng)導地位的一個(gè)真正威脅。在2016年12月20日美國白宮發(fā)布了《人工智能、自動(dòng)化與經(jīng)濟》報告,考察了人工智能驅動(dòng)的自動(dòng)化將會(huì )給經(jīng)濟帶來(lái)的影響,并提出了國家的三大應對策略方向??梢?jiàn),奧巴馬把人工智能看作其政治遺產(chǎn)之一(注:另一個(gè)是Cyber空間)。
英國政府2016年12月發(fā)布了《人工智能:未來(lái)決策的機遇與影響》的報告,關(guān)注人工智能對社會(huì )創(chuàng )新與生產(chǎn)力的促進(jìn)作用,論述如何利用英國人工智能的獨特優(yōu)勢,增強英國國力。
日本政府2017年開(kāi)始,要讓人工智能與機器人推動(dòng)第四次工業(yè)革命。
4 我國對策
應以深度卷積神經(jīng)網(wǎng)絡(luò )為核心,全面開(kāi)展計算機視覺(jué)、語(yǔ)音識別和自然語(yǔ)言等人工智能產(chǎn)品的開(kāi)發(fā)與大規模產(chǎn)業(yè)化應用。這需要大數據、計算平臺/計算引擎、人工智能算法、應用場(chǎng)景等飛速發(fā)展,另外還需要資源、資金、人才。在方法上,選定垂直細分領(lǐng)域最重要。
面向若干細分垂直領(lǐng)域,建立大數據中心。實(shí)現大數據采集、清洗、標簽、存儲、管理與交易,建立大數據源公共基礎設施與垂直領(lǐng)域知識庫。專(zhuān)有大數據是人工智能產(chǎn)業(yè)制勝的關(guān)鍵和法寶。中國企業(yè)必須開(kāi)始特別關(guān)注大數據的采集與利用。其重要性如同原油一樣,跨國企業(yè)視之為戰略資源!
強力開(kāi)展人工智能芯片與硬件平臺的研發(fā)。包括基于FPGA的深度學(xué)習芯片;類(lèi)腦芯片與憶阻器件;建立國家級人工智能超算中心。
布局通用人工智能與認知智能前沿技術(shù)探索。加強與腦科學(xué)、認知科學(xué)、心理學(xué)等的多學(xué)科交叉融合創(chuàng )新,推動(dòng)原創(chuàng )性基礎研究,為中國人工智能的應用與產(chǎn)業(yè)發(fā)展提供支撐。
創(chuàng )新體制機制,搶占人工智能戰略制高點(diǎn)。加強國家科技創(chuàng )新體系建設,改革學(xué)術(shù)與科研投入產(chǎn)出評估體系。面向國家重大戰略需求與經(jīng)濟社會(huì )發(fā)展急需,通過(guò)體系的創(chuàng )新來(lái)保障技術(shù)與產(chǎn)業(yè)創(chuàng )新的實(shí)現,打通“政、產(chǎn)、學(xué)、研、用”各個(gè)環(huán)節。例如建立國家DARPA(美國國防高級研究計劃局)和中國的阿拉莫國家實(shí)驗室。
本文來(lái)源于《電子產(chǎn)品世界》2017年第2期第23頁(yè),歡迎您寫(xiě)論文時(shí)引用,并注明出處。
評論