眾廠(chǎng)商談邊緣AI的技術(shù)與產(chǎn)品策略
高精度的FPGA架構
本文引用地址:http://dyxdggzs.com/article/201811/395028.htm無(wú)論是作為協(xié)處理器、獨立的處理單元亦或是簡(jiǎn)單的橋接,只要客戶(hù)尋求的價(jià)值定位是創(chuàng )新、快速上市、低延遲、靈活的IO以及可編程性,FPGA就有其獨特的優(yōu)勢。靈活I(lǐng)O可以在不同的應用場(chǎng)景支持不同類(lèi)別的傳感器,甚至處理多個(gè)傳感器交互和融合。AI目前還在初步階段,萊迪思預計神經(jīng)網(wǎng)絡(luò )引擎需要可編程性持續演進(jìn)和優(yōu)化。通用的MCU功耗和延遲一般會(huì )較高,加入固化的加速器雖然可以改善當下的性能,在未來(lái)幾年內不能持續優(yōu)化的缺陷會(huì )是個(gè)很大的限制。在新一版的CNN加速器IP,萊迪思針對了神經(jīng)網(wǎng)絡(luò )的需求來(lái)優(yōu)化了DRAM存儲器帶寬,使得ECP5的推理性能最多提升至2倍。
隨著(zhù)AI不斷火熱,IoT和智能傳感器市場(chǎng)將持續增長(cháng)。物聯(lián)網(wǎng)世界的多樣性也將是FPGA靈活架構大放異彩的機會(huì )。因此在超低功耗、低成本、小尺寸的iCE40 UltraPlus上,萊迪思也推出了輕量化CNN來(lái)滿(mǎn)足更靈活的性能、精度、功耗的平衡與取舍。盡管輕量化CNN比之前推出的二值神經(jīng)網(wǎng)絡(luò )(BNN)功耗稍高,但是其精度和性能也更優(yōu)秀,CNN在業(yè)界的接受度也比BNN更為廣泛。
更高性能的邊緣應用
Achronix的FPGA產(chǎn)品和技術(shù)專(zhuān)注于邊緣應用上的多種人工智能(AI)需求,例如汽車(chē)傳感器融合、目標檢測和識別、AI和機器學(xué)習,以及360度環(huán)繞視圖系統等需要在邊緣上本地處理數據的應用。
可編程邏輯提供了使計算更加以數據為中心的能力。雖然傳統的處理器都要求數據通過(guò)復雜的高速緩存層級被送到其流水線(xiàn)中,而可編程邏輯則能夠構建數據流水線(xiàn)。借助由定制邏輯電路和數字信號處理器(DSP)引擎組成的數據單元來(lái)在數據通過(guò)時(shí)操控它們,數據可以從一個(gè)節點(diǎn)到另一個(gè)節點(diǎn)無(wú)縫流動(dòng);每個(gè)單元都已準備好把數據轉發(fā)到需要它們的下一個(gè)節點(diǎn)。隨著(zhù)需求的變化,其中的邏輯陣列可以輕松地重新連線(xiàn)形成新的配置。與更適合處理控制密集型代碼的微處理器相比,這種邏輯陣列可以為以數據為中心的應用提供更好的支持。然而,獨立FPGA芯片通常會(huì )產(chǎn)生更大的功耗,這是因為需要將數據頻繁地移入和移出更專(zhuān)用的ASIC芯片中。
嵌入式FPGA(eFPGA)技術(shù)提供了一種方法,可以在一個(gè)封裝芯片中滿(mǎn)足邊緣計算應用的能效、性能、延遲和面積限制。結合eFPGA技術(shù),可以把平時(shí)部署在獨立的ASIC芯片中的常用功能在定制硬件中實(shí)現集成,以帶來(lái)更高的性能和密度。對于機器學(xué)習應用,這些功能可以是用于卷積內核或最大池計算的專(zhuān)用處理器陣列。通過(guò)在同一芯片上集成可編程邏輯和定制邏輯,可以避免在芯片外傳輸數據,從而節省大量功耗。
有關(guān)開(kāi)發(fā)環(huán)境和技術(shù)方面內容如下:
Speedcore?嵌入式FPGA:它是經(jīng)流片驗證的高密度、高性能eFPGA半導體知識產(chǎn)權(IP)產(chǎn)品。
Speedchip? FPGA合封芯片:FPGA合封芯片專(zhuān)為嵌入到先進(jìn)的系統級封裝(SiP)解決方案進(jìn)行了優(yōu)化,如通過(guò)硅介電層或有機基板實(shí)現了2.5D封裝。
Speedster?22i FPGA:這是一系列高性能和高密度FPGA芯片,帶有適用于通信應用的嵌入式系統IP,包括10 G / 100 G以太網(wǎng)、100 G Interlaken、PCIe Gen3×8和DDR3等。
PCIe Accelerator-6D加速板:它們是具有業(yè)界最高存儲器帶寬的、基于FPGA的PCIe附加卡,適用于高速加速應用。
Achronix?的自動(dòng)化設計(CAD)環(huán)境被稱(chēng)為ACE,它與行業(yè)標準的邏輯綜合工具配合使用,使FPGA設計人員能夠輕松地將其設計映射到Achronix FPGA芯片中。
支持生態(tài)系統與AI的開(kāi)發(fā)和應用
Imagination的業(yè)務(wù)是為半導體芯片提供必要的內核構建模塊。Imagination主要以自己的嵌入式圖形(GPU)技術(shù)和神經(jīng)網(wǎng)絡(luò )加速器(NNA)技術(shù)而聞名,并將這些技術(shù)授權給全球領(lǐng)先的芯片供應商。他們的半導體芯片廣泛應用于多種產(chǎn)品和服務(wù),因此Imagination在市場(chǎng)中擁有非常獨特的地位,因為Imagination可以支持整個(gè)生態(tài)系統參與人工智能(AI)的開(kāi)發(fā)和應用。
GPU和NNA現在是邊緣AI的必要元素。隨著(zhù)眾多企業(yè)開(kāi)始認識到在各種任務(wù)(從自然語(yǔ)言處理到圖像分類(lèi))中應用神經(jīng)網(wǎng)絡(luò )的潛力,引入人工智能元素的產(chǎn)品數量也開(kāi)始穩步增加。同時(shí),這些任務(wù)的處理正在從傳統的基于云架構轉移向設備端本身,基于硬件的專(zhuān)用神經(jīng)網(wǎng)絡(luò )加速器現在可嵌入至半導體芯片中,以實(shí)現本地的AI處理。從可監控前方道路的先進(jìn)駕駛輔助系統(ADAS)到虛擬助手等聲控的消費性電子產(chǎn)品,關(guān)于集成的、基于神經(jīng)網(wǎng)絡(luò )AI的機會(huì )正在向多個(gè)細分市場(chǎng)延伸。
不可否認,AI正在成為許多應用的必要元素。但是,仍然有很多挑戰。其中之一就是在邊緣和云之間平衡處理負載,并找到放置AI本身的最佳位置。例如,邊緣AI可用于消費性設備上的本地語(yǔ)音識別,比如識別“喚醒詞”或簡(jiǎn)單指令,但是依然有必要在云端進(jìn)行大部分的語(yǔ)音AI處理,以便利用那些無(wú)法在設備端存儲的龐大知識庫?,F在許多設備都標榜帶有AI,但實(shí)際上,除了依靠云端去給人智能的印象以外,就僅僅只是在本地做了簡(jiǎn)單的模式匹配和識別而已。
半導體工藝不斷演進(jìn),為在邊緣設備上進(jìn)行更多的AI處理創(chuàng )造了機會(huì )。例如,Imagination將看到能夠監控特定事件的智能安全攝像頭。它們將使用邊緣AI處理來(lái)識別視頻流中的特征,例如道路上的車(chē)輛或鏡頭中的人臉,然后觸發(fā)特定事件,例如計算車(chē)輛的數量或允許授權人員訪(fǎng)問(wèn)。他們甚至可以通過(guò)減少“誤報”的數量來(lái)節省成本,因為攝像頭中的邊緣AI可以識別正常行為和可疑行為之間的差異。
另一個(gè)挑戰是,盡管AI應用的數量在不斷增加,但這并不一定意味著(zhù)集成了AI加速功能的SoC是所有應用場(chǎng)景的前進(jìn)方向。的確,如果Imagination考慮AI去覆蓋大部分細分市場(chǎng),那么由于使用該技術(shù)的各種產(chǎn)品具有截然不同的工藝要求,碎片化會(huì )自然而然地發(fā)生。碎片化的市場(chǎng)對于使用專(zhuān)用SoC提供服務(wù)具有挑戰性,所以“一應俱全”的方法不會(huì )始終適用。雖然諸如手機或ADAS(高級駕駛員輔助系統)等一些市場(chǎng)為SoC供應商提供了大量機會(huì ),但許多以人工智能應用為目標的市場(chǎng)將自然呈現出低銷(xiāo)量前景。例如,一些產(chǎn)品可能需要AI進(jìn)行語(yǔ)音處理或圖像識別,但不是兩者都需要;同樣,智能家居供應商不大可能只為將AI功能嵌入他們的控制面板而去使用原本為智能手機設計的SoC,因為這不符合成本效益。這個(gè)難題的解決方案就是打造專(zhuān)用的AI芯片,其可以作為輔助芯片與主應用處理器一起使用,去卸載通常由主應用處理器中的NNA內核處理的AI推理任務(wù)。這樣做的優(yōu)勢是SoC供應商可以提供一系列具有不同性能水平的邊緣AI芯片;同時(shí),原始設備制造商(OEM)可以根據他們希望在自己的特定應用中所處理的AI處理開(kāi)銷(xiāo)來(lái)選擇適當地擴展產(chǎn)品解決方案。
RISC-V適合AI、物聯(lián)網(wǎng)等創(chuàng )新
有人預言,RISC-V或將是繼Intel和Arm之后的第三大主流處理器體系。實(shí)際上,三年前RISC-V基金會(huì )剛剛成立,如今已有200余家會(huì )員,會(huì )員遍布27個(gè)國家,得到了來(lái)自中國、印度、俄羅斯等國政府、高校、企業(yè)界的支持。RISC-V為何在短時(shí)間內受歡迎?
相比Intel和Arm,RISC-V有三大特點(diǎn)。
首先,從微處理器角度看,RISC-V的Core(核)設計得非常精巧、簡(jiǎn)單、有效,允許運行基本的操作系統。
其次,允許可擴展,由非營(yíng)利組織——RISC-V基金會(huì )運營(yíng)的,不像過(guò)去Intel和Arm等是由一家公司運營(yíng)的,RISC-V核是大家(Community)運營(yíng)的,只要加入基金會(huì ),成為基金會(huì )成員,就可以用。RISC-V的可擴充性允許開(kāi)發(fā)者加自己新的指令,而且允許開(kāi)發(fā)者的設計是開(kāi)源的,也可以不開(kāi)源,也可以用來(lái)賺錢(qián),也可以做研究……這種靈活的模式帶來(lái)了微處理器的革命。實(shí)際上,RISC-V是第一個(gè)硬件開(kāi)源的,開(kāi)源了ISA。ISA指令集是硬件與軟件的接口。
第三,帶來(lái)很多創(chuàng )新。在微處理器產(chǎn)品里,從IT和IC領(lǐng)域里,很長(cháng)時(shí)間里被Intel壟斷的,之后有Arm。由于知識產(chǎn)權的限制,其他公司不能使用Intel或Arm的ISA指令來(lái)做自己事情,除非得到授權。因此,多年來(lái),很少有開(kāi)發(fā)者在架構方面做創(chuàng )新。不過(guò),RISC-V開(kāi)了一扇門(mén),允許公司、高校師生、研究機構等做產(chǎn)品或進(jìn)行研究。有個(gè)形象的比喻,過(guò)去只有一種榔頭,做任何事都要用這個(gè)榔頭,現在允許大家開(kāi)發(fā)各種各樣的榔頭。
值得指出的是,RISC-V并不是比Intel和Arm好。因為Intel和Arm也是非常優(yōu)秀的公司,投入了大量資金和努力,開(kāi)發(fā)了很好的產(chǎn)品。區別在于那兩種芯片/架構是私人所有的,不是開(kāi)放、免費的,RISC-V是第一個(gè)在微處理器領(lǐng)域里把ISA指令架構開(kāi)放,這是一場(chǎng)革命,帶來(lái)了全新的商業(yè)形態(tài)和創(chuàng )新環(huán)境。
原來(lái)的商業(yè)模式,Intel和Arm把產(chǎn)品做好了,無(wú)法改變。但市場(chǎng)上應用場(chǎng)景在變,目前已經(jīng)超越PC和手機時(shí)代了。在很多應用場(chǎng)景,例如AI、物聯(lián)網(wǎng)和區塊鏈等有很多創(chuàng )新的應用,對架構有新的要求,老是用一套做是不行的,RISC-V允許核本身不動(dòng),基本ISA由community(社區)統一管理,允許加不同的東西進(jìn)來(lái),這樣可以把很多事情做好。
RISC-V的ISA是開(kāi)放和免費的。有三種模式:1.有可能開(kāi)源社區獲得免費的設計,像Linux;2.商業(yè)模式方面,有的是像致象爾、SiFive、晶心科技等公司,利用ISA設計芯片,銷(xiāo)售IP和設計,出售證書(shū)(licensing)或royality(版權);3.賣(mài)芯片。由表1可見(jiàn),Arm不做芯片,只做設計。Intel不賣(mài)設計,只出售芯片。RISC-V在這三個(gè)方面都可以。
參考文獻:
[1] 任澤坤.芯片廠(chǎng)商引領(lǐng)廣電的人工智能化[J],電子產(chǎn)品世界,2017(10);19~23
[2] 王瑩.人工智能的進(jìn)展及發(fā)展建議[J],電子產(chǎn)品世界,2017(2);19~23
[3] 有鵬,劉勇,楊林莉,等. 基于物聯(lián)網(wǎng)的圖像監控系統[J],電子產(chǎn)品世界,2017(7);37~40
本文來(lái)源于《電子產(chǎn)品世界》2018年第12期第11頁(yè),歡迎您寫(xiě)論文時(shí)引用,并注明出處。
評論