智能攝像頭將邁入64 位處理技術(shù)
本文引用地址:http://dyxdggzs.com/article/202201/430725.htm
隨著(zhù)筆記本電腦和智能手機的應用處理技術(shù)已經(jīng)遷移到 64 位,智能攝像頭也開(kāi)始轉向采用 64 位處理技術(shù),使得利用更先進(jìn)功能的前沿應用也可以在智能視覺(jué)系統中無(wú)縫平滑實(shí)現。例如,在世界各地的智慧城市中,我們看到攝像頭能夠運行AI算法來(lái)檢測人、寵物、包裹、車(chē)牌和其他物體。而且,隨著(zhù)攝像頭本地算力的提升以及AI技術(shù)在智能攝像頭中應用的不斷擴展,智能視覺(jué)處理工作負載不僅有可能在攝像頭內置的 CPU以及日趨普遍的加速器上直接運行,而且這種邊緣部署方式將越來(lái)越顯示其優(yōu)勢,并有望成為主流。在這些技術(shù)發(fā)展的助力下,未來(lái)將有可能同時(shí)檢測數百人或識別超速汽車(chē)的車(chē)牌,而無(wú)需再將大量數據傳輸到云端,影響處理的實(shí)時(shí)性。
為什么采用 64 位處理技術(shù)至關(guān)重要?
通過(guò)遷移至 64 位處理技術(shù),可以更好地利用先進(jìn)的64位CPU 硬件與身俱來(lái)的更高性能和效率。最重要的是,64 位 CPU 架構具有增強的寄存器支持和更大的內存映射。寄存器數量和寬度的增加意味著(zhù)可以在減少內存訪(fǎng)問(wèn)次數的情況下處理更大的數據集,從而加快數據處理速度。更強的寄存器支持也意味著(zhù)開(kāi)發(fā)者可以利用先進(jìn)的編譯器優(yōu)化技術(shù),從而進(jìn)一步提高性能。由于數據集在進(jìn)出本地內存的交換會(huì )影響性能,因此,當提升的寄存器支持結合了 64 位架構帶來(lái)的內存映射增加,軟件就可以直接訪(fǎng)問(wèn)更多的本地數據進(jìn)行處理,從而減少了對內存交換的需求。
隨著(zhù)智能攝像頭的成像要求日益提高,低端攝像頭和中高端攝像頭分別開(kāi)始采用 4K、8K 分辨率。從 1080p 提升至 4K 意味著(zhù)在相同的編碼方案下,攝像頭傳入視頻流的數據率翻倍。此外,為了更好地識別物體,幀率需要從 15fps 增加到 30fps 甚至 60fps,對數據率和性能的需求也將相應地繼續擴增。更高的幀率將使攝像頭能夠以更高的精度檢測、識別和辨別更小的物體與快速移動(dòng)的物體。從多個(gè)視頻流進(jìn)行同步 4K 編碼的需求,也對 CPU 性能提出了更高的要求。而這些都能很好地通過(guò) 64 位處理器獲得滿(mǎn)足。
此外,為了滿(mǎn)足成像和機器學(xué)習工作負載對于性能和帶寬不斷增長(cháng)的需求,智能攝像頭需要支持浮點(diǎn)運算。Armv8-A 64 位架構將單精度的每周期 FLOPS性能提高了 2 倍,雙精度中提高了 5 倍,從而改善了用戶(hù)體驗。
另外,從 Armv8 架構中的可收縮矢量擴展(Scalable Vector Extension, SVE)和 Armv9 架構中的 SVE2 開(kāi)始,Arm 通過(guò)對 Neon 的擴展在成像和機器學(xué)習方面取得了進(jìn)展,這一點(diǎn)也很重要。
圖 1:面向當前和未來(lái)智能攝像頭的 Arm 64 位 CPU
提升機器學(xué)習性能
Arm 64 位架構(稱(chēng)為 AArch64)提供了更快、更大的內存訪(fǎng)問(wèn),使機器學(xué)習模型能夠更快地加載到內存。這種性能的提升可以加快執行來(lái)自智能攝像頭的輸入視頻流的推理任務(wù),從而更快地檢測、識別和辨別圖像中的物體。
為了充分利用視頻編碼器/解碼器等片上加速器和處理器核心外部的機器學(xué)習硬件來(lái)實(shí)現高效的數據傳輸,必須優(yōu)化內存帶寬。提高系統內存流性能可以加快數據進(jìn)出內存的速度,以供許多不同的硬件單元使用。圖2顯示了最常見(jiàn)的內存流基準,并展示了從 32 位 CPU 遷移到 64 位 CPU 時(shí),性能可以提高 3.75 倍。
圖 2:從 Cortex-A7 (32 位) CPU 遷移到 Cortex-A35( 64 位) CPU 時(shí)的內存流性能提升
實(shí)現高級安全功能
64 位 ARMv8-A 架構在其 CPU 中提供了原生安全功能,其中加密指令 AES、SHA 和 CRC 可以在軟件加密的基礎上提供 3 至11 倍的性能提升,可用于小粒度加密技術(shù)。隨著(zhù) Arm 繼續提高關(guān)鍵加密操作的性能,智能攝像頭能夠持續改進(jìn)其加密算法,以支持物聯(lián)網(wǎng)應用對隱私和安全的持續需求。
圖 3:從 Cortex-A7 (32 位) CPU 遷移到 Cortex-A35 (64 位) CPU(帶有加密擴展)時(shí)的加密性能提升
對開(kāi)發(fā)者的影響:軟件和工具
與所有其他應用領(lǐng)域一樣,軟件和工具也將持續在智能攝像頭領(lǐng)域發(fā)揮著(zhù)重要作用,為廣大的開(kāi)發(fā)者持續創(chuàng )新提供動(dòng)力,使新功能和應用源源不斷地產(chǎn)生。隨著(zhù)對 64 位 Linux 發(fā)行版的支持繼續擴大,越來(lái)越多公司增加了對各種新功能的支持,如運行基于最新 Arm 架構的容器調度器。
此外,Arm 繼續利用最新 CPU 中的新功能來(lái)增強開(kāi)源的 GNU編譯器工具鏈。Arm 還增加了對領(lǐng)先的計算機視覺(jué)、圖像處理和機器學(xué)習開(kāi)源庫OpenCV的支持,從而賦能更多的開(kāi)發(fā)者能夠輕松開(kāi)發(fā)智能攝像頭應用和產(chǎn)品。
來(lái)自 Arm 和更廣泛生態(tài)系統的支持
Arm 將持續在最新的 64 位架構規格版本中提供與數字信號處理、矢量處理、機器學(xué)習和安全有關(guān)的增強功能,所有這些都是未來(lái)幾代智能攝像頭需要的關(guān)鍵計算處理能力。
在所有智能攝像頭中采用基于 64 位的 Arm處理器有諸多益處,其中關(guān)鍵的是可以得到來(lái)自生態(tài)系統的廣泛支持。例如,AWS 已經(jīng)通過(guò)其 AWS Sagemaker Neo 服務(wù),在任何支持 64 位 Armv8-A 的設備上增加了對機器學(xué)習推理的支持,使得那些計劃使用 AWS云服務(wù)進(jìn)行機器學(xué)習部署的公司可從中受益。
Project Cassini 等生態(tài)系統計劃解決了物聯(lián)網(wǎng)部署的兩個(gè)主要障礙:可擴展性和碎片化。對于芯片合作伙伴、ODM、OEM、ISV、系統集成商和開(kāi)發(fā)者來(lái)說(shuō),Project Cassini 通過(guò)加快在不同的Arm 64 位平臺上部署云原生應用,釋放了邊緣和物聯(lián)網(wǎng)計算潛力。而要能充分利用 Project Cassini 和 SystemReady? 計劃的優(yōu)勢, 64 位的計算平臺是必不可缺的要素。
為了加速邊緣設備的開(kāi)發(fā)和部署,Arm在2021年10月發(fā)布了 Arm 物聯(lián)網(wǎng)全面解決方案(Arm Total Solutions for IoT),其產(chǎn)品路線(xiàn)圖呈現了包括 Arm 虛擬硬件在內的全面解決方案的愿景,使客戶(hù)能夠在芯片流片前啟動(dòng)軟件開(kāi)發(fā)的工作。
總結
如果您想要在智能攝像頭生態(tài)系統中超越競爭對手,那么采用 64 位處理技術(shù)至關(guān)重要。Arm 樂(lè )于隨時(shí)為開(kāi)發(fā)者社區和合作伙伴提供支持,協(xié)助應對向 64 位處理技術(shù)過(guò)渡過(guò)程中的任何技術(shù)挑戰。向 64 位遷移將會(huì )開(kāi)創(chuàng )“雙贏(yíng)”局面。它將在性能、效率和安全方面為整個(gè)生態(tài)系統帶來(lái)諸多裨益,并有助于攝像頭滿(mǎn)足未來(lái)的創(chuàng )新,進(jìn)而改變我們的世界。
注:本文作者為Arm物聯(lián)網(wǎng)兼嵌入式事業(yè)部業(yè)務(wù)拓展 副總裁 馬健
評論