借助自適應計算迎接更加智能和互聯(lián)的世界
不斷變化和演進(jìn)的 5G、數據中心、汽車(chē)和工業(yè)等應用,要求在保持嚴苛的電源包絡(luò )的同時(shí),持續提升計算能力。隨著(zhù)人工智能( AI )技術(shù)商用進(jìn)程持續加速,其成為提升計算密度的一個(gè)主要因素。
本文引用地址:http://dyxdggzs.com/article/202202/431440.htm無(wú)論是部署在云端、邊緣還是終端,人工智能推斷都需要更高的處理性能和嚴格的功耗預算,因而,人工智能推斷工作負載,通常都需要專(zhuān)用的人工智能硬件來(lái)進(jìn)行加速。
與此同時(shí),人工智能算法的發(fā)展速度,遠遠超過(guò)了傳統芯片開(kāi)發(fā)周期的速度。由于先進(jìn)的人工智能模型的快速創(chuàng )新,固定芯片解決方案,如人工智能網(wǎng)絡(luò )的 ASIC 實(shí)現,有可能很快就會(huì )被淘汰。
自適應計算是應對上述挑戰的答案
因為基于在產(chǎn)品制造之后依然可以針對特定應用而進(jìn)行優(yōu)化的自適應硬件而打造,自適應計算因而擁有獨特的價(jià)值。由于優(yōu)化可以在硬件制造完成之后按需進(jìn)行,因此它可以保持與最新的人工智能模型與時(shí)俱進(jìn)金。相反,ASIC 因為基于固定的硬件架構,一旦制造完成就無(wú)法改變。
自適應計算的這種靈活的優(yōu)化能力,可以支持無(wú)限次地反復執行。甚至在器件被完全部署到量產(chǎn)環(huán)境后,依然可以進(jìn)行硬件的變更。就像一個(gè)量產(chǎn)型 CPU 可以被用來(lái)運行一個(gè)新程序一樣,一個(gè)自適應平臺也可以靈活適應新的硬件配置,甚至可以在一個(gè)實(shí)時(shí)的生產(chǎn)環(huán)境中。
自適應硬件與其它替代方案的對比
CPU 和 GPU 各自具有其獨特的能力,非常適合某些任務(wù)。CPU 是需要評估復雜邏輯的決策功能的最佳選擇。GPU 是處理高吞吐量但對時(shí)延要求不高的離線(xiàn)數據的最佳選擇。而自適應計算, 則是那些同時(shí)需要高吞吐量和低時(shí)延數據處理的最佳選擇,如實(shí)時(shí)視頻流、5G 通信和汽車(chē)傳感器融合等應用。
自適應計算之所以能夠在保證低時(shí)延的情況下提供高性能,是因為它能夠實(shí)現領(lǐng)域專(zhuān)用的架構( DSA ),從而保障特定應用在特定領(lǐng)域架構上的最佳實(shí)現。相反,CPU 和 GPU 基于固定的、馮-諾依曼的架構,不允許對其底層架構進(jìn)行針對特定領(lǐng)域的優(yōu)化。
DSA 也可以使用專(zhuān)用(固定)芯片器件來(lái)構建,通常被稱(chēng)為特定應用標準產(chǎn)品或ASSP 。但是,在固定 ASSP 中實(shí)現 DSA,既有 有優(yōu)勢,也有劣勢。這里介紹兩種主要的劣勢。
首先是創(chuàng )新步伐。為了跟上創(chuàng )新步伐,制造商被期望用更短的時(shí)間打造和提供新的服務(wù)。更具體來(lái)講,這個(gè)時(shí)間要比設計開(kāi)發(fā)新的固定芯片 DSA 所需的時(shí)間還要短。這就造成了市場(chǎng)的創(chuàng )新需求與企業(yè)設計制造 ASSP 所需時(shí)間之間的根本性市場(chǎng)錯位。行業(yè)標準改變或其他需求波動(dòng),會(huì )很快導致這些器件過(guò)時(shí)。
第二個(gè)考量因素是定制芯片的成本。設計與制造獨特的芯片設計(如復雜的 7nm ASIC)的一次性成本,可能導致數億美元的非重復性工程( NRE )成本。隨著(zhù)器件工藝縮小到 5nm 及更小,預計成本還將進(jìn)一步上升。成本的攀升,正在延緩 ASSP 對先進(jìn)節點(diǎn)的采用,而這,可能導致其用戶(hù)固守過(guò)時(shí)低效的技術(shù)。
自適應計算平臺介紹
自適應平臺都是基于相同的自適應硬件( FPGA )而打造,然而,它們所涵括的組件和 技術(shù)遠遠超過(guò)了芯片硬件和器件本身。自適應平臺包含了一套全面的運行時(shí)軟件,軟硬件相結合為打造高度靈活和高效的應用,提供了一種獨特的能力。
自適應平臺使得自適應計算能夠為廣泛的軟件和系統開(kāi)發(fā)者所使用,并為其打造眾多創(chuàng )新產(chǎn)品奠定了基礎。采用自適應平臺的優(yōu)勢包括:
● 縮短上市時(shí)間。使用 Alveo? 數據中心加速器卡這樣的平臺,可以支持其無(wú)需定制硬件,就可以通過(guò)專(zhuān)門(mén)為特定應用加速而打造的硬件構建應用。而且,僅需將 PCIe 卡連接到服務(wù)器,就可以用現有軟件應用程序直接調用加速庫。
● 降低運營(yíng)成本。與基于 CPU 的解決方案相比,由于計算密度的提升,基于自適應平臺的優(yōu)化應用能大幅提供每節點(diǎn)的效率。
● 靈活和動(dòng)態(tài)變化的工作負載。自適應平臺可根據當前需求重新配置。開(kāi)發(fā)者可以在自適應平臺內輕松切換已部署應用,使用相同設備即可滿(mǎn)足不斷變化的工作負載需求。
● 兼容未來(lái)。自適應平臺能不斷進(jìn)行調整。如果現有應用需要新的功能,則可以對硬件重新編程,以最佳方式實(shí)現這些功能,減少硬件升級需求,進(jìn)而延長(cháng)系統使用壽命。
● 加速整體應用。AI 推斷很少單獨存在。它是更大的數據分析與處理鏈條的一部分,往往與使用傳統(非 AI )實(shí)現方案的多個(gè)上游級和下游級并存。這些系統中的嵌入式 AI部分得益于 AI 加速,而非 AI 部分也能從加速中獲益。自適應計算的天然靈活性適合為 AI 和非 AI 處理任務(wù)進(jìn)行加速,這被稱(chēng)為“整體應用加速”。隨著(zhù)計算密集型 AI 推斷滲透到更多應用中,“整體應用加速”的重要性也在日益提升。
● 易用性。過(guò)去,運用 FPGA 技術(shù)需要開(kāi)發(fā)者構建自己的硬件板,并用硬件描述語(yǔ)言( HDL )配置 FPGA。相比之下,自適應平臺則支持開(kāi)發(fā)者使用自己熟悉的軟件框架和語(yǔ)言(例如 C++、Python、TensorFlow 等),直接發(fā)揮自適應計算的效能。軟件和 AI 開(kāi)發(fā)者現在也可以直接使用自適應計算,而無(wú)需構建電路板或成為硬件專(zhuān)家。
不同類(lèi)型的自適應計算平臺
根據應用和需求,存在多種類(lèi)型的自適應平臺,包括數據中心加速器卡和標準化邊緣模塊。多種平臺的存在,旨在為開(kāi)發(fā)所需應用提供盡可能最佳的起點(diǎn)。不同的自適應平臺所面向的應用類(lèi)型也十分廣泛,既有自動(dòng)駕駛和實(shí)時(shí)視頻流等時(shí)延敏感型應用,也有高度復雜的 5G 信號處理和非結構化數據庫的數據處理。
自適應計算能夠部署到云端、網(wǎng)絡(luò )、邊緣甚至終端,將最新的架構創(chuàng )新帶到單獨及端到端的應用。鑒于存在各種自適應平臺,部署位置也可以是多樣化的——從數據中心內 PCIe 加速器卡上的大容量器件,到適用于物聯(lián)網(wǎng)設備所需終端處理的小型低功耗器件。
邊緣端的自適應平臺,包括賽靈思 Kria? 自適應系統模塊( SOM ),數據中心中的自適應平臺包括 Alveo 加速器卡。Alveo 加速器卡采用行業(yè)標準的 PCIe,為任意數據中心應用提供了硬件卸載能力。
Kria自適應SOM
AI引擎的引入
自適應計算領(lǐng)域最大的創(chuàng )新之一,就是是賽靈思推出的 AI 引擎。
AI 引擎是一種革命性的新方法,其為計算密集型應用提供了前所未有的計算密度。AI 引擎從根本上說(shuō)仍然是一個(gè)可配置的塊,但它也可以像 CPU 一樣進(jìn)行編程。AI 引擎不是由標準的 FPGA 處理硬件組成的,而是包含高性能的標量和單指令多數據( SIMD )矢量處理器。這些處理器經(jīng)過(guò)優(yōu)化,用以高效實(shí)現人工智能推斷和無(wú)線(xiàn)通信中出現的各種計算密集型功能。
人工智能引擎陣列,仍然與類(lèi)似于 FPGA 的、靈活應變的數據互連相關(guān)接,從而能夠為目標應用建立高效、優(yōu)化的數據路徑。這種計算密集型的、類(lèi)似 CPU 的處理元素與類(lèi)似 FPGA 的互連組合,正引領(lǐng)人工智能和通信產(chǎn)品邁入一個(gè)新時(shí)代。
賽靈思AI引擎架構
迎接一個(gè)更加互聯(lián)和智能的世界
從根本上說(shuō),自適應計算建立在現有的 FPGA 技術(shù)上,但使其比以往任何時(shí)候都更容易被更多的開(kāi)發(fā)者和應用所接受。軟件和人工智能開(kāi)發(fā)者現在可以借助這種對他們來(lái)說(shuō)曾經(jīng)遙不可及的用自適應計算硬件技術(shù),快速打造優(yōu)化的應用。
使硬件適應特定應用的能力,是自適應計算區別于 CPU、GPU 和 ASSP 的獨特所在,后者的核心是固定的硬件架構。自適應計算允許硬件為應用量身定做,從而實(shí)現更高效率,而且如果未來(lái)工作負載或標準發(fā)生變化,其還能夠根據需求進(jìn)行調整。
隨著(zhù)世界變得更加互聯(lián)和智能,自適應計算將繼續占據優(yōu)化、加速應用的前沿,助力各種各樣的開(kāi)發(fā)者加速將創(chuàng )意變成現實(shí),讓我們的明天更美好。
評論