專(zhuān)為AI邊緣打造的i.MX RT700跨界MCU
i.MX RT700系列提供了高性能、高集成度、先進(jìn)功能和高能效的優(yōu)化組合,為支持智能AI的邊緣端設備賦能,例如可穿戴設備、消費電子醫療設備、智能家居設備和HMI設備。
本文引用地址:http://dyxdggzs.com/article/202411/464897.htm在i.MX RT500 和i.MX RT600 跨界MCU 的成功基礎上,恩智浦宣布推出i.MX RT700,超低功耗、集成多核和eIQ? Neutron 神經(jīng)處理單元(NPU)。
新一代i.MX RT700系列組合了前兩個(gè)系列的優(yōu)勢,進(jìn)一步降低了功耗,同時(shí)通過(guò)增加內核和其他架構增強功能提高了性能:
● 集成了恩智浦eIQ Neutron NPU AI/ML 加速器
● 高達7.5 MB 的低功耗內部SRAM 陣列,具有30個(gè)分區,可實(shí)現卓越的多核訪(fǎng)問(wèn)
● 新的圖形加速器包括硬件JPEG 和PNG 解碼,以及矢量圖形引擎和MIPI-DSI 接口
● 與前幾代產(chǎn)品相比,功耗降低了70%
● 1.2 V 低功耗eUSB 標準支持, 允許與標準USB2.0設備進(jìn)行交互
i.MX RT700 針對需要高性能感知、DSP 和計算能力的深度嵌入式應用,同時(shí)保持低功耗特性以延長(cháng)電池壽命。
深入了解i.MX RT700。查看結構框圖和產(chǎn)品規格。
圖1 i.MX RT700概述
1 帶有eIQ? Neutron NPU的多核架構
全新的i.MX RT700 CPU架構由高性能主計算子系統、以及“always-on”感知計算子系統和專(zhuān)用協(xié)處理器組成。主計算子系統使用運行頻率為325 MHz 的Arm? Cortex?-M33(CM33) 核。與i.MX RT600 跨界MCU一樣,i.MX RT700 包括Cadence Tensilica?HiFi 4 DSP。HiFi 4是基于超長(cháng)指令字(VLIW) 架構的高性能DSP 內核,每個(gè)指令周期最多可處理8 個(gè)32×16 MAC。它可用于分流對性能需求較高的信號處理任務(wù),如音頻和圖像處理,并支持定點(diǎn)和浮點(diǎn)運算。
CM33用作通用執行平臺,在系統啟動(dòng)時(shí)便可使用。它處理HiFi 4 DSP 以及其他協(xié)處理器和外部存儲器接口的初始啟動(dòng)。低功耗感知計算子系統由另一個(gè)250 MHz 的CM33 核和低功耗Cadence Tensilica?HiFi 1 DSP 組成。它主要用于需要始終在線(xiàn)的應用,能夠訪(fǎng)問(wèn)為超低功耗運行而調整的選定數量的通用外設。
應用包括PDM麥克風(fēng)接口的喚醒詞檢測、實(shí)時(shí)傳感器集線(xiàn)器和BLE 音頻處理。為了支持人工智能和機器學(xué)習模型加速,i.MX RT700 集成了eIQ? Neutron NPU。eIQ? Neutron是一種可擴展的硬件加速器架構,恩智浦專(zhuān)為人工智能和機器學(xué)習應用構建的多款產(chǎn)品均采用了該架構。
圖2 i.MX RT700結構框圖
i.MX RT700 采用eIQ Neutron N3-64 NPU,其性能介于MCX N947 MCU中的N1-16和高端i.MX 95應用處理器中的N3-1024之間。該NPU已針對深度嵌入式、低功耗應用進(jìn)行了調優(yōu),與通用處理器相比,可以實(shí)現172倍的性能提升,同時(shí)每次推理的功耗只有其119分之一。
eIQ機器學(xué)習軟件開(kāi)發(fā)環(huán)境可為使用恩智浦eIQNeutron神經(jīng)處理單元開(kāi)發(fā)AL/ML應用提供支持。該工具集為開(kāi)發(fā)人員提供了一個(gè)工作流程,幫助他們將TensorFlow Lite等常見(jiàn)機器學(xué)習框架的代碼轉換為可以在NPU上加速的同等計算圖。
圖3 eIQ Neutron NPU加速倍增器
i.MX RT700中另一個(gè)有趣的處理資源是基于開(kāi)放式RISC-V指令集架構(ISA) 的全新EZH-V IO協(xié)處理器。
EZH-V 中的RISC-V ISA 已實(shí)現了擴展:
● 添加硬件乘法和除法功能
● 添加浮點(diǎn)功能
● 添加位操作功能
● 提高了代碼密度
EZH-V可以執行用于后處理圖形數據的“SmartDMA”任務(wù),并作為GPU、CPU 和FlexIO 與MIPI DSI 等硬件接口之間的高速數據操作橋。它還可以用于任何其他通用IO 任務(wù),并連接到GPIO 和大多數片上外設的多種觸發(fā)輸入。EZH-V的代碼使用基于RISC-V LLVM的工具鏈開(kāi)發(fā),該工具鏈將在MCUXpresso SDK中提供。
2 面向處理、圖形和存儲的復雜內存架構
i.MX RT700中的內存架構針對不同內部處理資源之間靈活、低爭用的互連進(jìn)行了優(yōu)化。一個(gè)7.5MB的大型SRAM陣列分為30個(gè)分區,每個(gè)分區都可由總線(xiàn)控制器訪(fǎng)問(wèn),以減少CM33核、HiFi DSP、DMA控制器和EZH-V之間的爭用。大型內部存儲器可以快速訪(fǎng)問(wèn)大型圖形幀緩沖區,并能夠連接到內置的硬件JPEG和PNG解碼器。
30個(gè)獨立的SRAM分區都可以單獨用于代碼或數據存儲,專(zhuān)用于CPU,或在各個(gè)內核之間共享。每個(gè)分區都可以獨立地置于低功耗保留模式或完全斷電狀態(tài)。
有兩個(gè)XCACHE模塊用作專(zhuān)用系統和代碼緩存,可由計算子系統主用CM33 核、HiFi 4、EZH-V和兩個(gè)eDMA外設實(shí)例訪(fǎng)問(wèn)。這些緩存可以顯著(zhù)提高訪(fǎng)問(wèn)外部存儲器時(shí)的性能。HiFi 4有自己的本地緊耦合存儲器(TCM)以及本地指令/ 數據緩存,用于放置性能關(guān)鍵的DSP。
3 外部存儲器支持
與之前的i.MX RT500和i.MX RT600器件一樣,i.MX RT700采用了不帶閃存的架構。已包含3 個(gè)xSPI外部存儲控制器,用于與四線(xiàn)和八線(xiàn)閃存連接。其中兩個(gè)xSPI實(shí)例支持與外部PSRAM連接的16位接口,用于添加非易失性存儲器。xSPI接口支持高達400 MHz DDR和200 MHz SDR傳輸。這樣可以為大型ML 模型、數據緩沖區和圖形資產(chǎn)添加大塊快速外部RAM。通過(guò)xSPI 控制器連接的外部存儲器可以通過(guò)系統內存映射進(jìn)行訪(fǎng)問(wèn)。代碼可以從外部連接的閃存就地執行(XIP)。xSPI 接口被緩存,以確保最高性能。
xSPI控制器內置了一個(gè)靈活的基于查找表(LUT)的命令引擎,適用于幾乎任何NOR閃存。i.MX RT700Boot ROM可以使用連接到xSPI 接口的閃存來(lái)啟動(dòng)系統。有幾個(gè)選項可供選擇,包括將啟動(dòng)代碼復制到內部SRAM或直接就地執行(XIP)。加密代碼可以在從外部閃存訪(fǎng)問(wèn)時(shí)即時(shí)解密。
大容量存儲器可以通過(guò)SHDC/eMMC控制器連接。i.MX RT700的Boot ROM還支持從eMMC/SD卡啟動(dòng)系統。這使得SD/eMMC存儲器既能啟動(dòng)i.MX RT700,又可用于存儲配置和圖形資產(chǎn)的典型文件系統。
圖4 適用于可穿戴設備和個(gè)人健身應用
4 面向空間受限產(chǎn)品的封裝
i.MX RT700將提供324引腳7.3×7.3 mm、0.4 mm間距的扇出晶圓級(FOWLP) 和256引腳6.025×6.025 mm、0.35mm間距的晶圓級芯片級(WLCSP)兩種封裝。這些封裝使設計人員能夠將i.MX RT700嵌入到空間受限的區域。
高性能、超低功耗和密集封裝技術(shù)能夠顯著(zhù)提升可穿戴設備、個(gè)人健身設備、消費電子醫療設備和增強現實(shí)應用的性能和用戶(hù)體驗。
5 采用i.MX RT700的超低功耗、深度嵌入式設計
i.MX RT700代表著(zhù)低功耗嵌入式處理技術(shù)的重大進(jìn)步。i.MX RT700具有超低功耗和高處理能力,適用于許多需要長(cháng)電池壽命的應用,同時(shí)通過(guò)專(zhuān)用圖形加速器提供卓越的用戶(hù)體驗。
多核架構使設計人員能夠靈活地進(jìn)行產(chǎn)品設計。i.MX RT700組合了通用內核與高性能DSP 以及強大的NPU,能夠實(shí)現嵌入式產(chǎn)品差異化。
(本文來(lái)源于《EEPW》202411)
評論