自適應計算:走進(jìn)不斷擴張的Versal世界
2021 年 4 月,業(yè)界領(lǐng)先的 Versal? AI Core 和 Versal Prime 系列器件開(kāi)始全面量產(chǎn)發(fā)貨,這也意味著(zhù)賽靈思繼FPGA 之后而打造的ACAP 自適應計算加速平臺謝列,取得了令人激動(dòng)的階段性成果,
本文引用地址:http://dyxdggzs.com/article/202111/429727.htm但是就如同我們的宇宙萬(wàn)物一樣,Versal? 世界發(fā)展的腳步也從未停歇。從客戶(hù)設計,生態(tài)系統合作伙伴 (包括第三方參考設計、IP、軟件和操作系統支持)到產(chǎn)品系列 ( 如近期推出的 Versal AI Edge 和 HBM 系列 )及每個(gè)系列的多種器件,以及硬化 IP 特性,基準測試,軟 IP 庫和軟件庫等,齊頭并進(jìn),不斷推進(jìn)。
本文我將著(zhù)重為大家介紹人工智能開(kāi)發(fā)者最關(guān)注的 Versal AI Core 系列的最新發(fā)展。
Versal AI Core 系列的新特性
Versal AI Core 系列的最新擴展,是新增兩大 VC2xxx ACAP 系列,即 VC2802 和 VC2602。如果您認為 VC2xxxx 器件肯定意味著(zhù) AI Core 系列中增添了某些重要的新的硬化 IP 特性,恭喜您答對了!如下表所示,VC2xxx 系列帶來(lái)了三大激動(dòng)人心的新特性:
1.AIE-ML 是 AI 引擎的最新版本,其中包括緊密耦合的存儲器塊,可提供優(yōu)異的存儲器訪(fǎng)問(wèn)并降低時(shí)延
2.具有多個(gè)視頻解碼器引擎 (VDE) 的集成視頻解碼器單元 (VDU)
3.PCIe? Gen5 支持
關(guān)于A(yíng)IE-ML 及其與 VC1xxx 器件內的 AI 引擎的差異,詳見(jiàn) Xilinx.com 上的 AI 引擎技術(shù)頁(yè)面中的詳細介紹。
簡(jiǎn)單地說(shuō),AIE-ML 使用的是與 AI 引擎相同的基礎架構和工具流,但通過(guò)添加對 INT4、BFLOAT16 的原生支持,將每個(gè) AI 引擎的本地數據存儲器容量倍增至 64KB,并新增與 AIE-ML 陣列直接耦合的 512KB 存儲器塊(即無(wú)需將自適應引擎中的鄰近可編程邏輯 (PL) 用于存儲器緩存),AIE-ML 還能針對機器學(xué)習進(jìn)行進(jìn)一步優(yōu)化。這樣一來(lái),與 AI 引擎相比,AIE-ML 的 AI 計算密度提高 4 倍,時(shí)延降低一半,與 GPU 相比單位功耗性能增加 4 倍。每個(gè) AIE-ML 大約等同于 100 個(gè) DSP58、2000 個(gè) LUT,以及 16 個(gè) PL 的Block RAM,使用基于 PL 的實(shí)現方案可以將功耗節省 33%。
VDU 能夠支持單路 4Kp60 流的 H.264 和 H.265 編解碼,或者最多 32 路 720p15 流及兩者之間的所有編解碼。如果要想在 PL 中實(shí)現上述標準,那么每單元就需要 12 萬(wàn)個(gè) LUT、50 個(gè) DSP58 和 3 個(gè)Block RAM。使用硬化 VDU 后,可將每個(gè) VDU 的功耗降低 3.6W。這使其理想適用于眾多智能視頻應用。在這些應用中,多部視頻攝像頭向中央樞紐饋送數據,中央樞紐負責解碼并執行先進(jìn) ML 算法
此外,PCIe Gen5 還新增了對最先進(jìn)的 PCI Express 標準的支持。該標準即將在數據中心內部署,以在云端實(shí)現更大帶寬和更高智能。增加硬化 PCIe Gen5 支持能帶來(lái)可觀(guān)的效益,不僅能節省 30 萬(wàn) LUT,還能將每核心功耗降低節省 3W 。
智能應用
當然,VC2802 和 VC2602 ACAP 中的所有這些新特性,自然必有其用處。它們將支持大量全新的“智能”應用,在邊緣和世界各地的數據中心中廣泛部署。其中一個(gè)示例就是智慧城市應用。這類(lèi)應用使用多個(gè)視頻攝像頭監測車(chē)流或人流,并使用實(shí)時(shí) ML 算法評估實(shí)時(shí)流量或周邊安全。
另一種智能應用是零售領(lǐng)域的“智能零售防損”應用。視頻攝像頭可以用在商場(chǎng)和店鋪里,在銷(xiāo)售點(diǎn)實(shí)時(shí)監控商品失竊或商品貼標錯誤。損耗 (Shrinkage )是零售業(yè)的一大難題,智能零售應用能夠顯著(zhù)降低損耗率。
這些只是 Versal 生態(tài)系統通過(guò)擴張,支持新市場(chǎng)和新用例的一小部分示例。
入門(mén)指南
如果您已準備好立即加入 Versal設計的世界,我想推薦兩種評估與原型設計平臺作為您的起點(diǎn)。一個(gè)是 VCK190 套件,也是首款 Versal AI Core 系列評估套件。另一個(gè)是SmartLynq+ 模塊,為實(shí)現高速調試與追溯而構建,提供包含 AI 引擎在內的對 Versal 架構的完整可見(jiàn)性。
此外,我們還提供了豐富的文檔、示例、參考設計、資源和方法,為您在評估平臺上的開(kāi)發(fā)工作提速。如果您剛剛開(kāi)始接觸 Versal ACAP,也無(wú)需擔心!您可以先使用我們的設計流程助手 ( Design Flow Assistant)啟動(dòng)開(kāi)發(fā)規劃,然后使用我們的設計流程中心( Design Process Hubs),輕松地按設計流程找到全部文檔。此外,我們還在賽靈思 GitHub 上提供了大量的 Versal 和 Vitis 開(kāi)源示例和有針對性的參考設計。
后續更精彩
VC2802 和 VC2602 的加入,為 AI Core 系列帶來(lái)了激動(dòng)人心的新功能,然而, 這并不是全部,未來(lái)還會(huì )有更多令人興奮的消息。歡迎申請加入 Versal ACAP 快報更新列表,率先獲得最新產(chǎn)品訊息。
評論