Cadence弄潮神經(jīng)網(wǎng)絡(luò ),發(fā)布高性能DSP IP
近日,Cadence發(fā)布了首款面向汽車(chē)、監控、無(wú)人機和移動(dòng)市場(chǎng)的神經(jīng)網(wǎng)絡(luò )DSP IP,引起了業(yè)界的關(guān)注。
本文引用地址:http://dyxdggzs.com/article/201705/359564.htm實(shí)際上,多家公司正在推出或研制神經(jīng)網(wǎng)絡(luò )IP、芯片解決方案。Cadence的方案有何優(yōu)勢?Cadence公司Tensilica事業(yè)部資深市場(chǎng)群總監Steve Roddy為此專(zhuān)程來(lái)到北京,向媒體介紹其特點(diǎn)。
Vision C5概況
在神經(jīng)網(wǎng)絡(luò )的器件方面,英偉達主宰了通用GPU。此次Cadence Tensilica發(fā)布的神經(jīng)網(wǎng)絡(luò )DSP IP則是面向嵌入式芯片。
通常其他友商的方案是面向一個(gè)卷積神經(jīng)網(wǎng)絡(luò )(CNN)層,而最新的Cadence Tensilica Vision C5 DSP由于可配置,可以面向多種CNN。因為CNN更新很快,但從拿到IP到芯片上市通常要兩三年時(shí)間,因此固化硬件的方案會(huì )導致不能滿(mǎn)足未來(lái)的需求變化,所以并不合適,而此次發(fā)布的DSP IP帶來(lái)了靈活性,適合嵌入式系統中的NN(神經(jīng)網(wǎng)絡(luò ))實(shí)現。
C5的一大亮點(diǎn)是計算能力可達1T MAC/s,而面積在1mm2以?xún)?注:16nm工藝)。為何能如此高效率?原因之一是Cadence重新設計了NN加速器。通常的NN加速器中,HW(硬件) NN ACC(加速器)與Imaging(圖像)DSP、CPU或GPU的通訊/連接很繁瑣(如下圖),可能占整個(gè)計算工作量的40%。此次發(fā)布的C5 DSP可以把上述兩種功能IP/HW合二為一。
另外,Cadence還提供NN Mapper/Compiler開(kāi)源軟件工具。C5面向對NN有極高要求的視覺(jué)設備、雷達等,針對車(chē)載、監控、無(wú)人機、移動(dòng)/可穿戴等應用。
筆者注意到,此DSP IP叫Cadence Tensilica Vision C5 DSP,“Vision”即視覺(jué),即此DSP主要專(zhuān)注于計算機視覺(jué)應用。的確,在監控應用中,現在監控對實(shí)時(shí)性要求高,且數據傳輸到數據中心的代價(jià)巨大,不僅對網(wǎng)絡(luò )帶寬有很高的要求,另外安全性也需要保證。因此需要在終端側部署專(zhuān)用的視覺(jué)CNN處理芯片,以實(shí)現在終端側對數據進(jìn)行實(shí)時(shí),高效的處理。
C5與P6各有分工
實(shí)際上, Cadence有兩類(lèi)視覺(jué)DSP:一類(lèi)做NN處理(例如此次發(fā)布的C5),一類(lèi)做計算機視覺(jué)處理(例如Cadence的P5和P6)。二者均可配置,二者都支持多核方案。
具體應用中,常規圖像處理相關(guān)的視覺(jué)應用(例如去霧、去抖、暗光等),只需要常規的計算機視覺(jué)DSP即可,可以采用Cadence的Vision P5或Vision P6。而在比如視頻監控的NN處理中,需要增加Vision C5 DSP專(zhuān)門(mén)用于NN的處理(如下圖)。
C5與友商的差異化
最近,也有FPGA公司推出視覺(jué)導向的神經(jīng)網(wǎng)絡(luò )方案,Cadence如何看?實(shí)際上,專(zhuān)用芯片/ASIC的功耗更低,大批量制造成本也更低。另外,FPGA支持的運行頻率較低,只有幾十MHz,而Vision C5可以支持幾百MHz的運行頻率。
專(zhuān)用芯片由于應用不同,因此對計算的能力與需求不同,Tensilica可以幫助推薦和配置IP數。
相比同是處理器IP廠(chǎng)商的Synopsys與CEVA,后兩者的CNN方案需要三部分:控制、Imaging處理器、HW NN ACC(加速器)(如下圖左)。Cadence此次發(fā)布的C5把后兩部分集成在一起(如下圖右圖),因此只需要兩大塊,方案更為簡(jiǎn)潔,同時(shí)提高了Imaging處理的效率。
背景
據筆者所知,Cadence收購的Tensilica 是全球領(lǐng)先的DSP/MCU IP廠(chǎng)商,特點(diǎn)是高度可擴展,可配置,能夠廣泛的運用在各種不同性能要求的芯片產(chǎn)品領(lǐng)域。
被Cadence收購后,據Steve Roddy介紹,Tensilica也有著(zhù)不俗的業(yè)績(jì):目前每年出貨40億顆以上的處理器IP,在DSP許可(Licensing)營(yíng)收方面位列世界第一。聚焦音頻DSP IP。全球有200家以上的生態(tài)伙伴。全球20大半導體廠(chǎng)商中,有17家采用了Tensilica的IP。在中國,華為、MTK等手機芯片都采用了Cadence Tensilica的Vision DSP IP。
此次推出的C5,可謂該公司一次涉入CNN領(lǐng)域的新探索。雖然比一些同行晚一點(diǎn),但是準備得更充足。
評論