地平線(xiàn)鄭治泰:深度解讀軟件2.0時(shí)代AI無(wú)人化“玩法” | GTIC2020
在峰會(huì )上午場(chǎng),地平線(xiàn)首席戰略官鄭治泰,發(fā)表了題為《軟件2.0時(shí)代AI芯片的挑戰》的演講。
鄭治泰認為,AI系統的數據系統和計算系統,是軟件2.0時(shí)代的兩大要素。在未來(lái),機器將解決AI系統中的大部分問(wèn)題,而人類(lèi)科學(xué)家則負責對AI系統的算法參數進(jìn)行調優(yōu)。據此,地平線(xiàn)推出MAPS(在精度有保障范圍內的平均處理速度)評估方法,為人類(lèi)科學(xué)家調優(yōu)AI系統提供輔助。MAPS系統可通過(guò)可視化、量化的方式,在合理的精度范圍內,從“快”和“準”兩個(gè)維度評估芯片對數據的平均處理速度。此外,鄭治泰透露,地平線(xiàn)征程5芯片正在研發(fā)中,將于明年發(fā)布。相比業(yè)界某品牌同樣計劃于明年發(fā)布的GPU新品,征程5芯片有望實(shí)現至少3倍的性能提升。 在過(guò)去的五年中,地平線(xiàn)取得了比較好的商業(yè)成就。去年到今年,地平線(xiàn)的AI芯片實(shí)現量產(chǎn)上車(chē),并已達到10萬(wàn)的出貨量。明年,地平線(xiàn)將挑戰100萬(wàn)的AI芯片出貨量。
這些商業(yè)結果源于地平線(xiàn)對技術(shù)棧、技術(shù)趨勢的把握。在今天看得到的商業(yè)化落地結果背后,最根本的是面向未來(lái)的思考。 借助GTIC 2020 AI芯片創(chuàng )新峰會(huì )的平臺,鄭治泰分享了其對軟件2.0時(shí)代的思考,并回顧了人工智能發(fā)展的歷史。 鄭治泰認為,在軟件2.0時(shí)代,數據系統和計算系統兩個(gè)部分構成了整個(gè)AI系統。這其中,無(wú)論是數據系統還是計算系統,均由機器學(xué)習技術(shù)來(lái)解決最困難、最復雜的部分,人已經(jīng)不在其中發(fā)揮太多的作用。 當人和專(zhuān)家不再成為數據系統和計算的瓶頸的時(shí)候,人類(lèi)社會(huì )將會(huì )發(fā)生質(zhì)變,人類(lèi)將大踏步地進(jìn)入到AI時(shí)代。到那時(shí),由自動(dòng)駕駛引發(fā)的機器人時(shí)代也必將開(kāi)啟。
未來(lái)要實(shí)現AI系統的閉環(huán)無(wú)人化應用
鄭治泰認為,AI問(wèn)題,特別是面向一個(gè)復雜物理世界的問(wèn)題,需要一個(gè)新的解決范式。 傳統的算法采用的是拆解問(wèn)題的范式,即把問(wèn)題分解為子系統、子系統被分解為子模塊、在子模塊應用核心的算法?,F在看來(lái),這種方式幾乎失靈了。 大家可以想見(jiàn),假設一臺車(chē)在北京出廠(chǎng),它的用戶(hù)可能在新疆、海南、沙漠等地。如果這臺車(chē)產(chǎn)生的巨量corner case(極端情況),只能依靠專(zhuān)家、標定人員、測試人員進(jìn)行重新優(yōu)化和迭代算法,那么我們可能永遠無(wú)法實(shí)現人工智能驅動(dòng)的自動(dòng)駕駛。 也就是說(shuō),在未來(lái)的時(shí)候,我們需要實(shí)現整個(gè)人工智能系統的閉環(huán)無(wú)人化應用。 回顧機器視覺(jué)的發(fā)展,非常經(jīng)典的應用是用機器視覺(jué)方法識別圖片中的貓狗。這一應用中,計算機識別不同的點(diǎn)陣數據,并進(jìn)行數據計算。最終,計算機給出一個(gè)范式,確定圖片中是貓還是狗。這個(gè)問(wèn)題剛被提出時(shí),大家認為它的難度僅相當于一個(gè)本科生暑假作業(yè)的難度。 但是人類(lèi)社會(huì )對AI走進(jìn)物理世界的追求并未停止。在整個(gè)科技向前發(fā)展的過(guò)程中,盡管面臨失敗,科學(xué)家仍一次又一次地嘗試,去掌控發(fā)展的節奏和參與其中。
最初,機器視覺(jué)鼻祖馬爾提出“分解”的機器視覺(jué)方法。1986年到1990年間,人們用分解的方案解決機器視覺(jué)問(wèn)題,即對整個(gè)圖進(jìn)行描邊,形成有景深信息的二維圖片,再通過(guò)完整的幾何計算,抽象出三維物體。后來(lái),人們發(fā)現這一解決方案存在局限性,這是因為當面對不同角度下同一物體的圖片,或者同一角度不同光影下的物體圖片時(shí),計算機無(wú)法用上述的拆解數學(xué)模型去定義物體。 在1990年代,人工智能進(jìn)入到下一個(gè)階段??茖W(xué)家往后退了一步,將所有的物體類(lèi)別定義出來(lái),全部由數據系統使用機器識別方法去實(shí)現,通過(guò)不斷調優(yōu)、不停移動(dòng)分類(lèi)面,提升識別的精度和準確率。 后來(lái),人們又發(fā)現這一方法仍無(wú)法解決所有問(wèn)題。在整個(gè)物理世界中,一臺車(chē)面對著(zhù)十分復雜的外部環(huán)境,人類(lèi)想用幾個(gè)簡(jiǎn)單的數學(xué)公式集合完成整個(gè)定義是不可能的。 2012年至今,機器視覺(jué)發(fā)生了一個(gè)深刻的變革??茖W(xué)家和碼農開(kāi)始把整個(gè)計算過(guò)程全部交由機器去做,讓計算機做識別,而科學(xué)家則承擔模型結構和算法超參數調優(yōu)的工作。這一過(guò)程中,基于隨機的算法和參數,科學(xué)家評估輸入輸出的結果,不斷對不正確的gap進(jìn)行反向調優(yōu)。 2017年,專(zhuān)家又后退一步,將模型結構設計也交由機器學(xué)習來(lái)設計,依賴(lài)TPU提供的充沛算力。到2019年,機器設計的模型性能遠超過(guò)人類(lèi)專(zhuān)家設計出來(lái)的模型。 在軟件2.0時(shí)代,不增加數據的量,而增加計算量的時(shí)候,人們發(fā)現模型識別的錯誤率下降一半。如果數據量和計算量都提升的話(huà),模型識別錯誤率下降三分之二。增加計算量、增加數據量,都可以自動(dòng)化進(jìn)行。這意味著(zhù)機器自動(dòng)化、持續降低識別錯誤率是可能的。 為什么在海量數據和大模型的時(shí)代,機器會(huì )比人更加厲害?鄭治泰稱(chēng),這是因為人類(lèi)專(zhuān)家在抽象、局部有限的小數據、小模型應用中占據優(yōu)勢。但在大數據、大模型的應用中,計算機的準確識別和網(wǎng)絡(luò )設計能力,能夠超常發(fā)揮。 現在,利用機器學(xué)習重新開(kāi)發(fā)和設計網(wǎng)絡(luò )模型、重新計算識別的精度協(xié)議的趨勢,并沒(méi)有顯示出終止的跡象,這就催生出一個(gè)非常重要的可能性,即我們可以面向物理世界,提供AI服務(wù),即全自動(dòng)無(wú)人駕駛汽車(chē)等“像人一樣的智能”。
針對AI系統的數據和計算,這兩大軟件2.0時(shí)代的核心要素,人類(lèi)工程師在打造數據系統的閉環(huán)、提升數據閉環(huán)效率的同時(shí),還要結合軟件和硬件底層的邏輯設計,逐步提高計算的效率和性能。 基于此,地平線(xiàn)提出MAPS(在精度有保障范圍內的平均處理速度)的概念和評估方法。借助這套方法,客戶(hù)可以直接面向物理世界,評估AI系統的效能。這一方法并不是單純計算峰值算力或軟件的算法效率,而是計算這兩者在物理世界可接受的精度范圍內的處理速度。地平線(xiàn)計算的是什么?是AI系統能跑得多快、跑得多準。 為實(shí)現數據閉環(huán),幾乎所有的AI公司都在圍繞數據的搜集、采集、標注、模型訓練進(jìn)行部署。相較而言,地平線(xiàn)是利用自身的核心技術(shù)能力,給整個(gè)行業(yè)賦能。如果客戶(hù)需要打造一套完整的數據閉環(huán),地平線(xiàn)可以為其提供技術(shù)支持和服務(wù)。 鄭治泰透露,目前,地平線(xiàn)正與國內頭部的汽車(chē)企業(yè)攜手,打造不少于3~5個(gè)聯(lián)合實(shí)驗室。 通過(guò)這種聯(lián)合實(shí)驗室,地平線(xiàn)計劃為車(chē)企提供毫無(wú)保留的技術(shù)支持。地平線(xiàn)秉持開(kāi)放賦能的宗旨,可以提供芯片,也可以提供芯片+工具鏈,還可以提供芯片+工具鏈+算法。此外,就算客戶(hù)想要完全脫離地平線(xiàn)的技術(shù)產(chǎn)品來(lái)打造AI能力,地平線(xiàn)也會(huì )100%為客戶(hù)賦能。針對物理世界中的海量數據問(wèn)題,地平線(xiàn)以幫助合作伙伴具備真正的AI生產(chǎn)力為目標。
2015年,地平線(xiàn)成立,初創(chuàng )團隊具備算法背景。當時(shí),團隊發(fā)現在處理邊緣計算時(shí),需要在物理世界中定義一個(gè)問(wèn)題,提出算法模型。根據算法模型重新定義適合這個(gè)算法模型的芯片架構,芯片流片后,再回到物理世界中,求得一個(gè)最優(yōu)解。 鄭治泰認為,在計算閉環(huán)中,人類(lèi)科學(xué)家需要做到三件事: 第一,人類(lèi)科學(xué)家要持續提升這顆芯片的有效計算效率和計算能力; 第二,人類(lèi)科學(xué)家要持續提升算法的效率; 第三,人類(lèi)科學(xué)家需根據要解決的實(shí)際問(wèn)題,進(jìn)行聯(lián)合調優(yōu),得到最優(yōu)解。 地平線(xiàn)團隊認為,用傳統模型來(lái)進(jìn)行計算能力評估的方式是有局限性的。 首先,一些模型早已過(guò)時(shí),而要解決未來(lái)自動(dòng)駕駛場(chǎng)景中的實(shí)際問(wèn)題,需要更先進(jìn)的模型。芯片在設計的時(shí)候,就需要考慮到對未來(lái)模型、算法的引進(jìn)。其次,同一個(gè)芯片搭載不同的模型,其利用率也會(huì )表現出差異。 基于這兩點(diǎn),地平線(xiàn)從算法開(kāi)始進(jìn)行產(chǎn)品開(kāi)發(fā),然后再設計芯片,進(jìn)而回到場(chǎng)景中去解決實(shí)際問(wèn)題。
地平線(xiàn)征程5芯片明年發(fā)布,性能有望超競品3倍
據鄭治泰分享,地平線(xiàn)團隊MAPS評測結果顯示,市場(chǎng)上的高能效芯片,通常達到約30%的利用率。 人工智能面臨識別、檢測兩個(gè)問(wèn)題。在識別方面,相比市面上現有最好、最普遍的端側GPU產(chǎn)品,地平線(xiàn)的征程3芯片用8%的功耗實(shí)現了50%的MAPS,具備4~6倍的能耗優(yōu)勢;征程5芯片用50%的功耗實(shí)現了5倍的MAPS,實(shí)現了將近10倍的能耗優(yōu)勢。 檢測方面,地平線(xiàn)征程5芯片用50%的功耗實(shí)現了13倍的MAPS,達到26倍的提升。據稱(chēng),明年上述GPU品牌推出的新品,相比其上代產(chǎn)品實(shí)現了7倍的性能提升?;诖?,地平線(xiàn)將于明年推出的征程5芯片,相比該品牌明年發(fā)布的GPU新品,將有至少3倍的提升。 近期,地平線(xiàn)科學(xué)家定義的有效評估人工智能計算效能的方法,正為整個(gè)產(chǎn)業(yè)鏈賦能。鄭治泰提到,地平線(xiàn)希望,產(chǎn)業(yè)鏈伙伴都能使用這一方法,讓整個(gè)產(chǎn)業(yè)進(jìn)入非常良性的循環(huán)。 展望未來(lái),人類(lèi)科學(xué)家要做的事情并不多,其中包括搭建和調優(yōu)整個(gè)系統、看著(zhù)機器用海量數據輸出結果等。這就是軟件2.0所暗示的未來(lái),自動(dòng)駕駛、無(wú)人駕駛等人工智能應用,將普惠到每個(gè)人的生活。
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。