AI在邊緣設備上的發(fā)展機會(huì )
作者 / 王瑩 王金旺 《電子產(chǎn)品世界》編輯(北京 100036)
本文引用地址:http://dyxdggzs.com/article/201804/379031.htm摘要:AI不僅僅發(fā)生在對計算要求高的云端,還會(huì )出現在數量更加龐大的物聯(lián)網(wǎng)邊緣端,例如消費電子、汽車(chē)電子、工業(yè)控制、測試測量等領(lǐng)域。為此,本媒體邀請部分AI芯片及EDA/IP廠(chǎng)商,介紹邊緣AI的最新技術(shù)進(jìn)展和解決方案。
瑞薩AI終端問(wèn)題解決方案
針對終端上的AI執行,為了適配嵌入式系統,除了耗電問(wèn)題以外,還有其他需解決的問(wèn)題。首先,將通過(guò)云端開(kāi)放資源學(xué)習過(guò)的AI導入嵌入式系統的內存資源,其次,需要準備、提供適合執行AI的最優(yōu)設備;再次,不僅是單純處理,為實(shí)施實(shí)時(shí)性能、控制,還需具備安全性和可靠性。
瑞薩電子在終端嵌入AI,稱(chēng)為e-AI(Embedded Artificial Intelligence)。瑞薩從去年開(kāi)始免費開(kāi)放了e-AI Translator工具。這是可將通過(guò)Caffe、TensorFlow學(xué)習過(guò)的AI嵌入到所有MCU/MPU的壓縮工具。瑞薩電子的MCU/MPU產(chǎn)品線(xiàn)可以通過(guò)該工具,根據執行AI的大小,從豐富的產(chǎn)品線(xiàn)中選擇適配產(chǎn)品。
瑞薩考慮不僅在CPU,而且在終端中支持AI的應用需求。瑞薩將針對AI提供其獨特的處理器DRP (Dynamically Reconfigurable Processor)。就并行性而言,DRP優(yōu)于CPU;而就耗電量而言,DRP又優(yōu)于難以將全部數據導入的GPU。在相同耗電量的條件下,其測量結果是CPU的100倍以上,GPU的10倍以上。通過(guò)使用DRP,客戶(hù)將AI的識別功能應用于相機、機器人、AR眼鏡?,F在已經(jīng)有不少客戶(hù)在其新產(chǎn)品中積極推廣使用該技術(shù)。
瑞薩電子在其獨有產(chǎn)品SOTB(Si On Thin Buried-oxide)上也支持e-AI。通過(guò)利用該技術(shù),可將MCU的工作電流大幅降低至1/10,待機電流降低至1/100。該技術(shù)不僅可大幅延長(cháng)電池壽命,還使利用熱能、振動(dòng)、光、無(wú)線(xiàn)電波等能量轉換成電源的系統操作成為可能。對于傳感器網(wǎng)絡(luò )和健康看護可穿戴設備而言,通過(guò)在SOTB上嵌入e-AI,搭建僅將AI識別判斷后的結果傳輸的系統成為可能,從而大幅節電?,F在很多顧客開(kāi)始探討用SOTB來(lái)替代從前系統中的電池。
邊緣計算提高端云有效協(xié)作
恩智浦對邊緣側AI和IoT(物聯(lián)網(wǎng))戰略作用非常重視。我們認為大數據、IoT和AI的應用發(fā)展要求邊緣端具有以下能力:
1)對智能家居、工業(yè)互聯(lián)、智慧城市等提供智能化、快速和有效的支持;
2)從作為云端提供數據采集和控制反饋的連接通道,到云端訓練和深度學(xué)習,邊緣信息采集和AI識別的邊云一體化方向發(fā)展;
3)及時(shí)接收云端廣播訓練好的模型和提取的特征,在邊緣端提供有效的AI識別作用。
新趨勢對芯片和算法帶來(lái)的新要求
這樣的新趨勢也對芯片、計算架構及算法產(chǎn)生了新的要求。
首先,要求邊緣端的芯片對網(wǎng)絡(luò )傳輸、安全算法運算、數據存儲和AI算法有足夠的支持能力,即要有一定的綜合運算能力。具體包括;
1)網(wǎng)絡(luò )傳輸表示要及時(shí)地將用于學(xué)習和AI訓練的數據送到云端,避免網(wǎng)絡(luò )擁塞;
2)要對數據進(jìn)行安全保護和加解密的運算支持,要對設備、用戶(hù)和應用提供可信的認證;
3)對數據提供本地存儲和AI智能運算能力。
其次,對計算架構和算法產(chǎn)生了新要求,具體包括:
1) 提供端云有效配合的計算架構,實(shí)現云端學(xué)習和訓練,邊緣端特征提取和識別的有效AI應用的支持;
2)支持云端將學(xué)習好的模型及時(shí)廣播給聯(lián)接的邊緣設備,邊緣端利用訓練好的模型對新數據進(jìn)行識別和AI處理;
3)提供適用于邊緣端的AI算法、學(xué)習框架、運算庫和編譯環(huán)境。
恩智浦針對這樣的挑戰,在芯片SoC上提供了各種硬件加速引擎,包括網(wǎng)絡(luò )通信、安全存儲運算、AI運算,保證芯片在邊緣端強大的AI運算能力;提供了支持邊緣計算的EdgeScale平臺,除了安全管理和邊緣設備管理外,它會(huì )封裝用于A(yíng)I的算法和系統庫,簡(jiǎn)化AI的開(kāi)發(fā)。并提供AI應用的開(kāi)發(fā)示例,例如人臉識別、OCR、語(yǔ)音識別、物體識別等,為AI應用的快速落地帶來(lái)方便。另外,它提供了針對工業(yè)互聯(lián)場(chǎng)景的邊緣平臺架構OpenIL,從實(shí)時(shí)性、安全性、穩定性和傳輸性上對邊緣端提供有效保障。
應用于自動(dòng)駕駛的邊緣 AI 視覺(jué)
自動(dòng)駕駛汽車(chē)中的每一個(gè)傳感器都需要得到精密算法的支持,算法可以生成傳感器數據的感知解讀。最新趨勢是利用深度學(xué)習算法來(lái)生成感知解讀。不過(guò),深度學(xué)習算法必須通過(guò)大量可能出現的情境加以訓練,才能學(xué)會(huì )如何去解讀各種可能出現的傳感器數據。訓練后,為了實(shí)現車(chē)輛的安全操控,深度學(xué)習算法需要極低時(shí)延的超高計算性能。這必須通過(guò)低功耗熱約束且延長(cháng)電動(dòng)汽車(chē)的電池續航時(shí)間來(lái)實(shí)現。賽靈思可提供所需的高性能、功率效率和自適應性,充分滿(mǎn)足自動(dòng)駕駛汽車(chē)中邊緣AI 的需求。
賽靈思旨在利用邊緣 AI 視覺(jué)幫助實(shí)現自動(dòng)駕駛車(chē)輛,讓城市更安全,讓工廠(chǎng)具有更高生產(chǎn)力,這也是業(yè)界發(fā)展趨勢所在。這一技術(shù)創(chuàng )新正在眾多層面不斷快速演進(jìn)和發(fā)展,如系統、算法以及傳感器層面等。賽靈思技術(shù)可對芯片上的晶體管功能進(jìn)行深層的細化控制,從而幫助創(chuàng )新人員實(shí)現更高的靈活應變性。
這種 AI 創(chuàng )新在自動(dòng)駕駛汽車(chē)的開(kāi)發(fā)中日益顯現。例如BMW 760i(2010 款)中的早期主動(dòng)巡航控制使用單一的前視雷達,新投產(chǎn)的特斯拉 Model 3將傳感器配置提升為 8 個(gè)高分辨率視頻攝像頭、12 個(gè)超聲波傳感器和一個(gè)前視雷達,可實(shí)現司機監控操作的自動(dòng)駕駛功能(僅作為駕駛輔助功能,并非完全自動(dòng)駕駛)。隨著(zhù)全自動(dòng)駕駛汽車(chē)面臨的挑戰不斷得到解決,傳感器的數量與類(lèi)型也將持續增加,LIDAR、紅外線(xiàn)視頻等技術(shù)將嶄露頭角,雷達與攝像頭的數量也越來(lái)越多。
邊緣 AI 性能實(shí)證(與 NVIDIA Tegra TX2 相比):
1)3 倍的機器學(xué)習推導性能;
2)42 倍的傳感器處理性能;
3)每幅圖像實(shí)時(shí)性能的時(shí)延僅為 0.33 ms。
Arm三大平臺助力建設開(kāi)放式AI生態(tài)系統
AI能力已經(jīng)從云端向包括邊緣和終端的前端迅速遷移,現階段的主要挑戰是前端的成本和功耗限制下的AI計算能力提升要求及軟件生態(tài)。邊緣AI算力已經(jīng)開(kāi)始快速迭代,多數的檢測和識別任務(wù)將會(huì )在前端就地完成,設備的響應速度、可靠性會(huì )提高,數據的隱私性會(huì )提高。但如何保護算法產(chǎn)權自身的安全性,同時(shí)降低應用的開(kāi)發(fā)難度和普及門(mén)檻需要解決。
芯片作為前端智能應用的基礎支撐載體,如何解決以上相關(guān)挑戰,發(fā)揮Arm生態(tài)優(yōu)勢,加強產(chǎn)業(yè)協(xié)作是不可忽略的一環(huán)。Arm中國和生態(tài)伙伴創(chuàng )立的OPEN AI LAB提供優(yōu)化的算法庫HCL、算法模型加速引擎Tengine和SDK開(kāi)發(fā)包AID,致力于提升前端AI計算效率、降低應用開(kāi)發(fā)門(mén)檻。同時(shí),Arm人工智能生態(tài)聯(lián)盟AIEC致力于推動(dòng)從芯片、算法、解決方案、系統集成、部署落地的全產(chǎn)業(yè)鏈協(xié)作,加速AI前端應用落地和普及。
除此以外,Arm也為滿(mǎn)足用戶(hù)對移動(dòng)設備、智能電視更高要求的視覺(jué)體驗、4K HDR視頻等新興需求持續研發(fā)新IP及解決方案。顯示技術(shù)、圖層數據處理能力、增值視頻體驗,這些都是Arm現在及未來(lái)賦予廣大移動(dòng)用戶(hù)的價(jià)值所在。
Arm三大平臺方案
Arm著(zhù)力于為合作伙伴提供平臺型解決方案,目前已推出三大平臺:
一是機器學(xué)習平臺Project Trillium,全面支持主流的深度學(xué)習模型以及傳統CV。開(kāi)發(fā)者能夠繼續使用他們首選的框架和工具,經(jīng)Arm開(kāi)發(fā)軟件無(wú)縫轉換結果后,可在底層平臺上運行。
其二是平臺安全架構PSA,為IoT安全提供了一套全面的安全指導方針,使從芯片制造商到設備開(kāi)發(fā)商,再到云服務(wù)平臺等價(jià)值鏈中的每位成員都能成功實(shí)現安全運行。
其三是Arm Mbed平臺,支持多協(xié)議,將IoT設備安全地連接至云,將數據安全地送上云。
以上三大平臺不僅賦能合作伙伴創(chuàng )新應用解決方案,更是Arm致力共建產(chǎn)業(yè)標準與開(kāi)發(fā)者生態(tài)、激活增值解決方案與服務(wù)的基礎。Arm始終希望,聯(lián)合行業(yè)價(jià)值鏈中的所有成員,合力建設開(kāi)放式協(xié)作創(chuàng )新與共同成長(cháng)的生態(tài)系統。
評論