眾廠(chǎng)商談邊緣AI的技術(shù)與產(chǎn)品策略
作者 / 王瑩 毛爍 《電子產(chǎn)品世界》記者
本文引用地址:http://dyxdggzs.com/article/201811/395028.htm摘要:人工智能和物聯(lián)網(wǎng)兩股浪潮同時(shí)涌現,兩者相互融合,相輔相成,不僅推動(dòng)著(zhù)技術(shù)的發(fā)展,也推動(dòng)著(zhù)時(shí)代的進(jìn)步。各大元器件廠(chǎng)商對于這兩股時(shí)代浪潮也各有高見(jiàn)。
實(shí)時(shí)低功耗AI處理解決方案
瑞薩電子致力于為實(shí)現環(huán)保,智能型社會(huì )而貢獻力量,而僅通過(guò)使用云的大數據處理是無(wú)法實(shí)現更安全和健康的生活的。
憑借靈活且可擴展的嵌入式人工智能(e-AI)概念,瑞薩電子提供了面向未來(lái)的實(shí)時(shí)低功耗AI處理解決方案,該解決方案在業(yè)界是獨特的,它可在嵌入式端點(diǎn)設備中實(shí)現人工智能的特定需求。瑞薩正在為其智能工廠(chǎng)、智能家居,智能基礎設施和新業(yè)務(wù)部門(mén)方向努力,例如服務(wù)機器人等重點(diǎn)領(lǐng)域的客戶(hù)探索新的嵌入式人工智能解決方案。 瑞薩電子將繼續與客戶(hù)和合作伙伴展開(kāi)合作。
通過(guò)使用由UC
Berkeley開(kāi)發(fā)的Caffe或Google開(kāi)發(fā)的TensorFlow,任何人都可以相對輕松地使用AI(人工智能)。DNN(深度神經(jīng)網(wǎng)絡(luò ))是在各種AI專(zhuān)業(yè)領(lǐng)域中最常用的算法之一。DNN由兩個(gè)主要部分組成:
學(xué)習和推理。
DNN在學(xué)習和推理執行所需的計算量方面存在很大差異,它的一個(gè)主要特征是它在推理階段可以以較低的計算能力執行。
瑞薩電子的e-AI解決方案提議是在Cloud方面繼續學(xué)習執行,但推理執行轉移到MCU / MPU(如圖1)。 優(yōu)點(diǎn)是它可以支持更安全,可靠,快速的AI系統。
為了在嵌入點(diǎn)中執行推理階段,嵌入式AI 方案有兩個(gè)主要挑戰:
1.嵌入式系統實(shí)現AI的難點(diǎn)在于,AI系統和MCU / MPU的語(yǔ)言不同。 將AI模型轉換到MCU / MPU并不容易。 我們需要有一個(gè)有效的工具來(lái)轉換模型,然后妥善適合MCU / MPU存儲區。
(備注:Python是在許多AI模型中比較通用的語(yǔ)言,而MCU的控制程序通常用C / C ++。)
2.AI推理將遷移到邊緣和端點(diǎn)系統,作為新的硬件架構解決方案, 它必須真正平衡行業(yè)領(lǐng)域的要求,包括解決功率效率、市場(chǎng)靈活性、功能安全要求和實(shí)時(shí)響應。瑞薩電子有相關(guān)的技術(shù)和開(kāi)發(fā)環(huán)境來(lái)解決這兩個(gè)問(wèn)題。
支持e-AI開(kāi)發(fā)環(huán)境
瑞薩電子e-AI人工智能開(kāi)發(fā)環(huán)境可以把學(xué)習后的AI模型輸入到e-AI翻譯器,并將其轉換為e2Studio C / C ++項目的可用形式。它是一種方便易用的工具,把AI功能簡(jiǎn)單地實(shí)現到MCU / MPU上(如圖2)。
DRP技術(shù)實(shí)現低功耗AI處理
動(dòng)態(tài)可重配置處理器(DRP)是一種可編程架構,可動(dòng)態(tài)切換數據路徑,使高度復雜的加速器能夠在不增加功率要求的情況下運行并行指令。FPGA和DRP在邏輯中使用類(lèi)似的布線(xiàn)結構和并行技術(shù),但DRP由大型子組件組成,而不是像FPGA那樣的細粒度配置。這意味著(zhù)DRP重新配置所需的時(shí)間比包括FPGA在內的其他架構要少。
DRP的可配置性允許架構繼續適應和支持深度學(xué)習神經(jīng)網(wǎng)絡(luò )的變化。DRP技術(shù)具有高速處理能力和消耗更少功率的特點(diǎn)在嵌入式AI系統擁有明顯優(yōu)勢。
面向輕型機器學(xué)習,恩智浦出臺eIQ開(kāi)發(fā)環(huán)境及芯片
機器學(xué)習將驅動(dòng)下一波MCU增長(cháng)
IoT推動(dòng)了這幾年MCU的更新?lián)Q代,而下一波MCU的助推器是終端的機器學(xué)習,包括家庭環(huán)境、聲音處理、手勢控制、智能感測、智能控制、多攝像頭觀(guān)察、個(gè)人資產(chǎn)、主動(dòng)目標識別、AR(增強現實(shí))等。
典型的案例之一是目前發(fā)展火熱的人機界面的聲音處理,會(huì )推動(dòng)下一波白電等家電應用的需求。例如在2018年10月的Arm TechCon2018(Arm技術(shù)大會(huì ))上,恩智浦展示了聲控洗衣機,可以與洗衣機對話(huà),例如:“打開(kāi)洗衣機”。洗衣機會(huì )問(wèn):“你要怎樣洗?”可以回答:“我要標準洗”或“強力洗”。也可以告訴洗衣機洗什么樣的衣物,例如洗被子,或用什么方式洗,例如熱水洗、冷水洗等,洗衣機就自動(dòng)設置好。
再例如圖形的識別,恩智浦在美國的一個(gè)DEMO(演示)是交通指示標識識別,機器能夠識別紅綠燈、是路還是人,假設指示標識斜著(zhù)、模糊一點(diǎn),機器都可以辨認出來(lái)。
邊緣AI的芯片布局
恩智浦有全套的MCU、MPU產(chǎn)品線(xiàn),從低端MCU一直到高端的四核、八核高端處理器,所有這些芯片都可以用在機器學(xué)習、邊緣計算上??蛻?hù)不僅可以在云端進(jìn)行訓練,還可以通過(guò)軟件的推理,在終端的處理器上進(jìn)行應用。
恩智浦的AI開(kāi)發(fā)環(huán)境是eIQ,也是機器學(xué)習(ML)的開(kāi)發(fā)環(huán)境。底端的硬件平臺有傳統的MCU和MPU,諸如Kinetis、LPC等Cortex-M核的MCU產(chǎn)品,還有新的i.MX RT系列跨界處理器,高端的i.MX6、7、8等處理器,以及Layerscape處理器。
硬件平臺里,運算的部分是核和硬件加速器,有Cortex-R、M和A核,GPU、DSP中放的是DSP核,未來(lái)一兩年內,恩智浦還將開(kāi)發(fā)ML(機器學(xué)習)的加速硬件,這不同于大型的云端硬件加速,而是可以跨平臺、跨處理器和微控制器的用于終端計算的ML加速器。
在芯片之上是硬件抽象層,諸如OpenCL,OpenVX,Arm的計算庫/ CMSIS-NN,還有恩智浦的API等。再往上是推理機(Inference Engine),有很多種,主推的有Google的TensorFlow、TF Lite等。實(shí)際上,恩智浦支持所有開(kāi)發(fā)環(huán)境?,F在還有新的NN Compiler(編譯器),例如Facebook的GLOW等。
在基于所有的機器學(xué)習軟件硬件結合之后,恩智浦推出了全套的解決方案,包括音視頻及機械傳感器的解決方案(例如壓力、加速度傳感器的解決方案)。同時(shí)針對各種應用,推出了應用上的解決方案,例如ISP(圖像信號處理)、圖像加速、傳感器融合、全景環(huán)視(注:過(guò)去通常是車(chē)上用,現在家居方面也有很多應用),還有前端的聲音的控制,諸如多揚聲器。
在揚聲器方面,如果是兩個(gè)揚聲器,用比較簡(jiǎn)單便宜的MCU就足夠了,例如LPC和Kinetis系列;如果更多揚聲器,由于數據處理量很大,適合用i.MX RT跨界處理器平臺,或i.MX 7、8、8M等高端處理器。
可見(jiàn)根據不同的應用,恩智浦有不同的處理器配合,這是eIQ的概念。恩智浦的目標是讓外界主流的推理機都能運行在恩智浦的硬件上。
恩智浦也有全套的芯片,覆蓋高端到低端。其中高端的i.MX用的是GPU、DSP,未來(lái)一兩年內,恩智浦還會(huì )推出ML加速硬件,是真正的專(zhuān)用加速器。
賽普拉斯:物聯(lián)網(wǎng)產(chǎn)品的高性能軟硬件解決方案
隨著(zhù)越來(lái)越多的物聯(lián)網(wǎng)設備接入和應用的復雜多樣化,邊緣計算和安全越來(lái)越多地被市場(chǎng)討論且成為關(guān)注焦點(diǎn)。這些新的技術(shù)和趨勢對嵌入式芯片是機遇也是挑戰。
物聯(lián)網(wǎng)的部署是為了更智能、更便捷和更有效率,因此人工智能的應用是一種必然的趨勢:通過(guò)真實(shí)世界量化后的大數據分析,由計算結果代替或者輔助執行使得結果更優(yōu)化。這些分析和計算通常在云端進(jìn)行,然后隨著(zhù)對實(shí)時(shí)性的要求提升以及應用場(chǎng)景的復雜程度,越來(lái)越多的應用開(kāi)始考慮把計算放在物聯(lián)網(wǎng)終端或者節點(diǎn)端,比如智能語(yǔ)音識別的本地化,比如3D人臉識別的圖像預處理本地化等。這樣的應用要求處理器具有高性能的處理能力,同時(shí)滿(mǎn)足低功耗、低成本的物聯(lián)網(wǎng)設備的普遍需求,整體上提升了嵌入式芯片的處理能力和性能功耗比的門(mén)檻。
與此同時(shí),物聯(lián)網(wǎng)安全也開(kāi)始從可選項變?yōu)楸剡x項,隨著(zhù)愈加成熟和詳細的行業(yè)規范的推出,比如智能門(mén)鎖,物聯(lián)網(wǎng)設備對安全的需求從簡(jiǎn)單的數據通信加密、安全啟動(dòng)防篡改,發(fā)展到需要有效和安全的硬件隔離來(lái)實(shí)現可信執行環(huán)境,從而確保物聯(lián)網(wǎng)的安全服務(wù),不受其它應用服務(wù)的更新的影響或者非安全訪(fǎng)問(wèn)的威脅。這對嵌入式芯片的安全架構提出了更嚴格的要求。
賽普拉斯半導體的PSoC 6微控制器結合了以上提到的高性能、超低功耗和高安全性特點(diǎn),從系統架構和工藝上一開(kāi)始就考慮了邊緣計算和高安全的物聯(lián)網(wǎng)需求,是為下一代物聯(lián)網(wǎng)量身定制的處理器。同時(shí)結合賽普拉斯領(lǐng)先的Wi-Fi和藍牙無(wú)線(xiàn)連接技術(shù),以及結合了PSoC Creator和WICED無(wú)線(xiàn)應用SDK(軟件開(kāi)發(fā)包)的Modus Toolbox開(kāi)發(fā)工具,為物聯(lián)網(wǎng)產(chǎn)品開(kāi)發(fā)者提供了完整的高性能軟硬件解決方案。該開(kāi)發(fā)套件不僅集成了本地語(yǔ)音處理和身份驗證等計算功能,還在PSoC 6雙核架構基礎上實(shí)現了靈活、安全的可信執行環(huán)境,并提供亞馬遜和阿里巴巴的安全云服務(wù)連接開(kāi)發(fā)套件。賽普拉斯公司新成立的物聯(lián)網(wǎng)計算和無(wú)線(xiàn)部門(mén)在未來(lái)五年將繼續大力開(kāi)發(fā)物聯(lián)網(wǎng)芯片、軟件和解決方案,為市場(chǎng)提供好的產(chǎn)品和服務(wù)。
面向AI等應用推出自適應加速平臺及加速卡
對于幾何級變化的數據計算時(shí)代,芯片的開(kāi)發(fā)速度已經(jīng)遠遠跟不上創(chuàng )新的速度。為此,Xilinx于2018年10月推出了自適應加速平臺——ACAP,是軟硬件可編程平臺,首款產(chǎn)品名為Versal,制程7 nm,包含FPGA和異構加速等復雜結構。為了滿(mǎn)足數據中心加速需要,Xilinx還推出了Alveo加速器卡,用于數據中心和AI,芯片制程16 nm。其中,Alveo U200 和 Alveo U250 由 Xilinx UltraScale+ FPGA提供動(dòng)力。
靈活芯片與專(zhuān)用芯片的應用比拼
那么,既然現有芯片已經(jīng)很難跟上數據和計算的幾何級發(fā)展,固定功能的AI芯片發(fā)展前景如何?實(shí)際上,ACAP或者Alveo產(chǎn)品不會(huì )取代所有GPU,但是人們肯定會(huì )越來(lái)越多采用靈活應變的平臺。
相比GPU、CPU,ACAP的引爆點(diǎn)在哪里?GPU現在在深度學(xué)習訓練這一塊應用非常多,但是它的功耗很高。但是Xilinx并不是特別關(guān)注訓練這個(gè)市場(chǎng),而是更多關(guān)注后面的推斷這部分的市場(chǎng),包括在數據中心和邊緣計算,GPU用得并不多,CPU有一定的應用,但是性能和時(shí)延不太理想。這也是為什么Xilinx在推斷這個(gè)領(lǐng)域,包括在智慧城市、自動(dòng)駕駛汽車(chē)上已經(jīng)有了很多的訂單,相比GPU、CPU更有競爭力。
反過(guò)來(lái)再看訓練市場(chǎng),現在GPU占據的市場(chǎng)份額比較多,但是這個(gè)市場(chǎng)基本處于飽和的狀態(tài)。而推斷這個(gè)市場(chǎng)仍然處于初期、快速上升期,現在正處于從CPU向加速卡轉換的階段,很多分析師預測未來(lái)的推斷市場(chǎng)比訓練市場(chǎng)規模大很多,因為訓練只需要一次,但是最終推斷可能是成百上千倍的應用規模。
如何看待很多初創(chuàng )公司在做AI芯片?
現在無(wú)論是AI還是別的類(lèi)型芯片,任何的先進(jìn)技術(shù)要發(fā)展,如果是用16 nm、7 nm的技術(shù),所需要的投資都是巨大的,很多小企業(yè)可能沒(méi)有足夠的資金,無(wú)論是在芯片的開(kāi)發(fā)還是在量產(chǎn)方面,尤其實(shí)現量產(chǎn)需要非常大的投資,這對于所有做AI和其他應用的企業(yè)來(lái)說(shuō)都是一大挑戰。
既然如此,AI初創(chuàng )公司應該如何去創(chuàng )新?被大公司收購是出路之一,例如2018年7月,北京的深鑒科技公司被Xilinx收購。因為大公司能夠充分利用創(chuàng )新的技能和知識來(lái)擴大客戶(hù)群,幫助小公司更快地影響業(yè)界,而無(wú)需初創(chuàng )公司自己去融資,還要來(lái)重復執行大公司很多優(yōu)勢領(lǐng)域的方案。所以初創(chuàng )企業(yè)應該關(guān)注自己的創(chuàng )新,而大公司擅長(cháng)的部分可以由大公司來(lái)做,而不是由初創(chuàng )企業(yè)投資幾億元去做芯片。
深鑒的技術(shù)特色
Xilinx過(guò)去幾年在A(yíng)I邊緣計算上投入了很多資源,例如2018年7月,Xilinx收購了深鑒科技。深鑒科技也是用賽靈思的 Zynq SoC技術(shù),面部識別就是深鑒非常重要的一個(gè)技術(shù)應用領(lǐng)域。深鑒科技有一個(gè)剪枝技術(shù),是基于神經(jīng)網(wǎng)絡(luò )來(lái)進(jìn)行優(yōu)化的技術(shù),也就是將神經(jīng)元需要計算的數量來(lái)進(jìn)行裁減,使得真正計算的神經(jīng)元少一些,即使一些小的FPGA也可以進(jìn)行計算。
類(lèi)比一下,就像一個(gè)小孩小的時(shí)候腦神經(jīng)元比較多,長(cháng)大的時(shí)候使用的神經(jīng)元數量反而少了,但是這些神經(jīng)元的可用效率和效果是非常好的,隨著(zhù)人逐漸長(cháng)大,對神經(jīng)元的訓練使得少部分的神經(jīng)元更加強大了。還有模塊上的系統FPGA可以嵌在IP攝像頭和PCI-e卡里,這都是在邊緣計算里的。
高精度的FPGA架構
無(wú)論是作為協(xié)處理器、獨立的處理單元亦或是簡(jiǎn)單的橋接,只要客戶(hù)尋求的價(jià)值定位是創(chuàng )新、快速上市、低延遲、靈活的IO以及可編程性,FPGA就有其獨特的優(yōu)勢。靈活I(lǐng)O可以在不同的應用場(chǎng)景支持不同類(lèi)別的傳感器,甚至處理多個(gè)傳感器交互和融合。AI目前還在初步階段,萊迪思預計神經(jīng)網(wǎng)絡(luò )引擎需要可編程性持續演進(jìn)和優(yōu)化。通用的MCU功耗和延遲一般會(huì )較高,加入固化的加速器雖然可以改善當下的性能,在未來(lái)幾年內不能持續優(yōu)化的缺陷會(huì )是個(gè)很大的限制。在新一版的CNN加速器IP,萊迪思針對了神經(jīng)網(wǎng)絡(luò )的需求來(lái)優(yōu)化了DRAM存儲器帶寬,使得ECP5的推理性能最多提升至2倍。
隨著(zhù)AI不斷火熱,IoT和智能傳感器市場(chǎng)將持續增長(cháng)。物聯(lián)網(wǎng)世界的多樣性也將是FPGA靈活架構大放異彩的機會(huì )。因此在超低功耗、低成本、小尺寸的iCE40 UltraPlus上,萊迪思也推出了輕量化CNN來(lái)滿(mǎn)足更靈活的性能、精度、功耗的平衡與取舍。盡管輕量化CNN比之前推出的二值神經(jīng)網(wǎng)絡(luò )(BNN)功耗稍高,但是其精度和性能也更優(yōu)秀,CNN在業(yè)界的接受度也比BNN更為廣泛。
更高性能的邊緣應用
Achronix的FPGA產(chǎn)品和技術(shù)專(zhuān)注于邊緣應用上的多種人工智能(AI)需求,例如汽車(chē)傳感器融合、目標檢測和識別、AI和機器學(xué)習,以及360度環(huán)繞視圖系統等需要在邊緣上本地處理數據的應用。
可編程邏輯提供了使計算更加以數據為中心的能力。雖然傳統的處理器都要求數據通過(guò)復雜的高速緩存層級被送到其流水線(xiàn)中,而可編程邏輯則能夠構建數據流水線(xiàn)。借助由定制邏輯電路和數字信號處理器(DSP)引擎組成的數據單元來(lái)在數據通過(guò)時(shí)操控它們,數據可以從一個(gè)節點(diǎn)到另一個(gè)節點(diǎn)無(wú)縫流動(dòng);每個(gè)單元都已準備好把數據轉發(fā)到需要它們的下一個(gè)節點(diǎn)。隨著(zhù)需求的變化,其中的邏輯陣列可以輕松地重新連線(xiàn)形成新的配置。與更適合處理控制密集型代碼的微處理器相比,這種邏輯陣列可以為以數據為中心的應用提供更好的支持。然而,獨立FPGA芯片通常會(huì )產(chǎn)生更大的功耗,這是因為需要將數據頻繁地移入和移出更專(zhuān)用的ASIC芯片中。
嵌入式FPGA(eFPGA)技術(shù)提供了一種方法,可以在一個(gè)封裝芯片中滿(mǎn)足邊緣計算應用的能效、性能、延遲和面積限制。結合eFPGA技術(shù),可以把平時(shí)部署在獨立的ASIC芯片中的常用功能在定制硬件中實(shí)現集成,以帶來(lái)更高的性能和密度。對于機器學(xué)習應用,這些功能可以是用于卷積內核或最大池計算的專(zhuān)用處理器陣列。通過(guò)在同一芯片上集成可編程邏輯和定制邏輯,可以避免在芯片外傳輸數據,從而節省大量功耗。
有關(guān)開(kāi)發(fā)環(huán)境和技術(shù)方面內容如下:
Speedcore?嵌入式FPGA:它是經(jīng)流片驗證的高密度、高性能eFPGA半導體知識產(chǎn)權(IP)產(chǎn)品。
Speedchip? FPGA合封芯片:FPGA合封芯片專(zhuān)為嵌入到先進(jìn)的系統級封裝(SiP)解決方案進(jìn)行了優(yōu)化,如通過(guò)硅介電層或有機基板實(shí)現了2.5D封裝。
Speedster?22i FPGA:這是一系列高性能和高密度FPGA芯片,帶有適用于通信應用的嵌入式系統IP,包括10 G / 100 G以太網(wǎng)、100 G Interlaken、PCIe Gen3×8和DDR3等。
PCIe Accelerator-6D加速板:它們是具有業(yè)界最高存儲器帶寬的、基于FPGA的PCIe附加卡,適用于高速加速應用。
Achronix?的自動(dòng)化設計(CAD)環(huán)境被稱(chēng)為ACE,它與行業(yè)標準的邏輯綜合工具配合使用,使FPGA設計人員能夠輕松地將其設計映射到Achronix FPGA芯片中。
支持生態(tài)系統與AI的開(kāi)發(fā)和應用
Imagination的業(yè)務(wù)是為半導體芯片提供必要的內核構建模塊。Imagination主要以自己的嵌入式圖形(GPU)技術(shù)和神經(jīng)網(wǎng)絡(luò )加速器(NNA)技術(shù)而聞名,并將這些技術(shù)授權給全球領(lǐng)先的芯片供應商。他們的半導體芯片廣泛應用于多種產(chǎn)品和服務(wù),因此Imagination在市場(chǎng)中擁有非常獨特的地位,因為Imagination可以支持整個(gè)生態(tài)系統參與人工智能(AI)的開(kāi)發(fā)和應用。
GPU和NNA現在是邊緣AI的必要元素。隨著(zhù)眾多企業(yè)開(kāi)始認識到在各種任務(wù)(從自然語(yǔ)言處理到圖像分類(lèi))中應用神經(jīng)網(wǎng)絡(luò )的潛力,引入人工智能元素的產(chǎn)品數量也開(kāi)始穩步增加。同時(shí),這些任務(wù)的處理正在從傳統的基于云架構轉移向設備端本身,基于硬件的專(zhuān)用神經(jīng)網(wǎng)絡(luò )加速器現在可嵌入至半導體芯片中,以實(shí)現本地的AI處理。從可監控前方道路的先進(jìn)駕駛輔助系統(ADAS)到虛擬助手等聲控的消費性電子產(chǎn)品,關(guān)于集成的、基于神經(jīng)網(wǎng)絡(luò )AI的機會(huì )正在向多個(gè)細分市場(chǎng)延伸。
不可否認,AI正在成為許多應用的必要元素。但是,仍然有很多挑戰。其中之一就是在邊緣和云之間平衡處理負載,并找到放置AI本身的最佳位置。例如,邊緣AI可用于消費性設備上的本地語(yǔ)音識別,比如識別“喚醒詞”或簡(jiǎn)單指令,但是依然有必要在云端進(jìn)行大部分的語(yǔ)音AI處理,以便利用那些無(wú)法在設備端存儲的龐大知識庫?,F在許多設備都標榜帶有AI,但實(shí)際上,除了依靠云端去給人智能的印象以外,就僅僅只是在本地做了簡(jiǎn)單的模式匹配和識別而已。
半導體工藝不斷演進(jìn),為在邊緣設備上進(jìn)行更多的AI處理創(chuàng )造了機會(huì )。例如,Imagination將看到能夠監控特定事件的智能安全攝像頭。它們將使用邊緣AI處理來(lái)識別視頻流中的特征,例如道路上的車(chē)輛或鏡頭中的人臉,然后觸發(fā)特定事件,例如計算車(chē)輛的數量或允許授權人員訪(fǎng)問(wèn)。他們甚至可以通過(guò)減少“誤報”的數量來(lái)節省成本,因為攝像頭中的邊緣AI可以識別正常行為和可疑行為之間的差異。
另一個(gè)挑戰是,盡管AI應用的數量在不斷增加,但這并不一定意味著(zhù)集成了AI加速功能的SoC是所有應用場(chǎng)景的前進(jìn)方向。的確,如果Imagination考慮AI去覆蓋大部分細分市場(chǎng),那么由于使用該技術(shù)的各種產(chǎn)品具有截然不同的工藝要求,碎片化會(huì )自然而然地發(fā)生。碎片化的市場(chǎng)對于使用專(zhuān)用SoC提供服務(wù)具有挑戰性,所以“一應俱全”的方法不會(huì )始終適用。雖然諸如手機或ADAS(高級駕駛員輔助系統)等一些市場(chǎng)為SoC供應商提供了大量機會(huì ),但許多以人工智能應用為目標的市場(chǎng)將自然呈現出低銷(xiāo)量前景。例如,一些產(chǎn)品可能需要AI進(jìn)行語(yǔ)音處理或圖像識別,但不是兩者都需要;同樣,智能家居供應商不大可能只為將AI功能嵌入他們的控制面板而去使用原本為智能手機設計的SoC,因為這不符合成本效益。這個(gè)難題的解決方案就是打造專(zhuān)用的AI芯片,其可以作為輔助芯片與主應用處理器一起使用,去卸載通常由主應用處理器中的NNA內核處理的AI推理任務(wù)。這樣做的優(yōu)勢是SoC供應商可以提供一系列具有不同性能水平的邊緣AI芯片;同時(shí),原始設備制造商(OEM)可以根據他們希望在自己的特定應用中所處理的AI處理開(kāi)銷(xiāo)來(lái)選擇適當地擴展產(chǎn)品解決方案。
RISC-V適合AI、物聯(lián)網(wǎng)等創(chuàng )新
有人預言,RISC-V或將是繼Intel和Arm之后的第三大主流處理器體系。實(shí)際上,三年前RISC-V基金會(huì )剛剛成立,如今已有200余家會(huì )員,會(huì )員遍布27個(gè)國家,得到了來(lái)自中國、印度、俄羅斯等國政府、高校、企業(yè)界的支持。RISC-V為何在短時(shí)間內受歡迎?
相比Intel和Arm,RISC-V有三大特點(diǎn)。
首先,從微處理器角度看,RISC-V的Core(核)設計得非常精巧、簡(jiǎn)單、有效,允許運行基本的操作系統。
其次,允許可擴展,由非營(yíng)利組織——RISC-V基金會(huì )運營(yíng)的,不像過(guò)去Intel和Arm等是由一家公司運營(yíng)的,RISC-V核是大家(Community)運營(yíng)的,只要加入基金會(huì ),成為基金會(huì )成員,就可以用。RISC-V的可擴充性允許開(kāi)發(fā)者加自己新的指令,而且允許開(kāi)發(fā)者的設計是開(kāi)源的,也可以不開(kāi)源,也可以用來(lái)賺錢(qián),也可以做研究……這種靈活的模式帶來(lái)了微處理器的革命。實(shí)際上,RISC-V是第一個(gè)硬件開(kāi)源的,開(kāi)源了ISA。ISA指令集是硬件與軟件的接口。
第三,帶來(lái)很多創(chuàng )新。在微處理器產(chǎn)品里,從IT和IC領(lǐng)域里,很長(cháng)時(shí)間里被Intel壟斷的,之后有Arm。由于知識產(chǎn)權的限制,其他公司不能使用Intel或Arm的ISA指令來(lái)做自己事情,除非得到授權。因此,多年來(lái),很少有開(kāi)發(fā)者在架構方面做創(chuàng )新。不過(guò),RISC-V開(kāi)了一扇門(mén),允許公司、高校師生、研究機構等做產(chǎn)品或進(jìn)行研究。有個(gè)形象的比喻,過(guò)去只有一種榔頭,做任何事都要用這個(gè)榔頭,現在允許大家開(kāi)發(fā)各種各樣的榔頭。
值得指出的是,RISC-V并不是比Intel和Arm好。因為Intel和Arm也是非常優(yōu)秀的公司,投入了大量資金和努力,開(kāi)發(fā)了很好的產(chǎn)品。區別在于那兩種芯片/架構是私人所有的,不是開(kāi)放、免費的,RISC-V是第一個(gè)在微處理器領(lǐng)域里把ISA指令架構開(kāi)放,這是一場(chǎng)革命,帶來(lái)了全新的商業(yè)形態(tài)和創(chuàng )新環(huán)境。
原來(lái)的商業(yè)模式,Intel和Arm把產(chǎn)品做好了,無(wú)法改變。但市場(chǎng)上應用場(chǎng)景在變,目前已經(jīng)超越PC和手機時(shí)代了。在很多應用場(chǎng)景,例如AI、物聯(lián)網(wǎng)和區塊鏈等有很多創(chuàng )新的應用,對架構有新的要求,老是用一套做是不行的,RISC-V允許核本身不動(dòng),基本ISA由community(社區)統一管理,允許加不同的東西進(jìn)來(lái),這樣可以把很多事情做好。
RISC-V的ISA是開(kāi)放和免費的。有三種模式:1.有可能開(kāi)源社區獲得免費的設計,像Linux;2.商業(yè)模式方面,有的是像致象爾、SiFive、晶心科技等公司,利用ISA設計芯片,銷(xiāo)售IP和設計,出售證書(shū)(licensing)或royality(版權);3.賣(mài)芯片。由表1可見(jiàn),Arm不做芯片,只做設計。Intel不賣(mài)設計,只出售芯片。RISC-V在這三個(gè)方面都可以。
參考文獻:
[1] 任澤坤.芯片廠(chǎng)商引領(lǐng)廣電的人工智能化[J],電子產(chǎn)品世界,2017(10);19~23
[2] 王瑩.人工智能的進(jìn)展及發(fā)展建議[J],電子產(chǎn)品世界,2017(2);19~23
[3] 有鵬,劉勇,楊林莉,等. 基于物聯(lián)網(wǎng)的圖像監控系統[J],電子產(chǎn)品世界,2017(7);37~40
本文來(lái)源于《電子產(chǎn)品世界》2018年第12期第11頁(yè),歡迎您寫(xiě)論文時(shí)引用,并注明出處。
評論