<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 設計應用 > 移動(dòng)算法 而非巨量數據

移動(dòng)算法 而非巨量數據

作者:Simon Holt 時(shí)間:2022-06-27 來(lái)源:CTIMES 收藏

機器學(xué)習進(jìn)步使我們能夠處理越來(lái)越大量?jì)Υ尜Y料。傳統方法是將數據傳輸到算法設備,但是這種移動(dòng)巨量數據(高達 1 PB)以供可能只有幾十兆位元算法來(lái)進(jìn)行處理真的有意義嗎?因此,在靠近數據儲存位置處理數據的想法引起了很多關(guān)注。本文研究了計算儲存理論和實(shí)踐,以及如何使用計算儲存處理器 (CSP) 為許多計算密集型任務(wù)提供硬件加速和更高性能,而不會(huì )給主機處理器帶來(lái)大量負擔。

崛起
近年來(lái),算法在汽車(chē)、工業(yè)、安全和消費等應用中使用顯著(zhù)增加?;谶吘壩锫?lián)網(wǎng)傳感器通常只處理少量數據,因此所使用算法占用很少代碼空間。然而,伴隨微控制器處理能力提高和功耗降低,機器學(xué)習算法在邊緣應用中使用開(kāi)始呈指數級增長(cháng)。卷積用于視覺(jué)處理以及工業(yè)和汽車(chē)應用中對象檢測。例如,視覺(jué)處理系統可用于檢測標簽是否正確貼在高速工業(yè)生產(chǎn)線(xiàn)的瓶子上。

視覺(jué)系統還適用于更復雜任務(wù),例如根據對象類(lèi)型、條件和大小對物體進(jìn)行分類(lèi)。在汽車(chē)應用中,使用實(shí)時(shí)視覺(jué)系統進(jìn)行多物體分類(lèi)和識別能夠更充分利用神經(jīng)網(wǎng)絡(luò )。除了具體市場(chǎng)應用外,神經(jīng)網(wǎng)絡(luò )也可用于科學(xué)研究。例如,它可廣泛用于處理由分布在全球各地遙感衛星和地震監測傳感器收集的大量資料。

在大多數應用中,機器學(xué)習用于增加正確觀(guān)察和分類(lèi)對象概率。然而,為此目的的訓練算法需要大型(高達 PB),這些移動(dòng)、處理和儲存都具有非常大挑戰性。

計算儲存
近年來(lái),基于NAND閃存普及程度快速增長(cháng),這種技術(shù)不再局限于高端儲存,還可用于一般商品固態(tài)儲存,一個(gè)典型用例是正在取代筆記本電腦和桌面計算機中的磁盤(pán)驅動(dòng)器。固態(tài)儲存普及,加上NVMe協(xié)議興起(支持更高帶寬、更低延遲和更高儲存密度)以及 PCIe 連接帶來(lái)的更高數據速率,為我們提供了重新思考如何使用儲存和計算資源方法的機會(huì )。

圖片.png 
圖一 : 具有計算和儲存平面的傳統計算架構。(source:BittWare)

圖一所示傳統方法可在計算平面和儲存平面之間移動(dòng)數據。計算資源用于數據傳輸、處理、壓縮和解壓縮以及許多其他系統相關(guān)任務(wù)。所有這些任務(wù)的組合對可用資源造成沉重負擔。

圖片.png
 
圖二 : 計算儲存架構。(source:BittWare)

圖二所示計算儲存架構是一種更有效方法。它透過(guò)使用硬件加速器(通常在FPGA 上)來(lái)執行計算密集型任務(wù)。將 NVMe 閃存靠近并連接到硬件加速器,CPU 不再需要將數據從其儲存位置移動(dòng)到處理位置附近,從而顯著(zhù)降低運行負擔。如圖三所示,FPGA在其中扮演計算儲存處理器角色,從而能夠減輕 CPU 處理壓縮、加密或神經(jīng)網(wǎng)絡(luò )推理等計算密集型任務(wù)負擔。

圖片.png
 
圖三 : 計算儲存處理器 (CSP)。(source:BittWare)

基于 FPGA 的計算儲存處理器
計算儲存處理器的一個(gè)例子是 BittWare IA-220-U2,它采用 Intel Agilex FPGA(具有多達 140 萬(wàn)個(gè)邏輯組件、多達 16GB DDR4 內存和四個(gè) PCIe Gen4 接口)。 DDR4 SDRAM 能夠以高達 2,400 MT/s 速率傳輸數據,它使用符合 SFF-8639 標準的 2.5 英寸 U.2 封裝和對流冷卻散熱器,能夠整合到 U.2 NVMe 儲存數組,如圖 4 所示。

圖片.png
 
圖四 : BittWare IA220-U2。(source: BittWare)

BittWare IA-220-U2通常消耗 20W功率,并支持熱插入,它具有板載 NVMe-MI且兼容 SMBus 控制器、SMBus FPGA 閃存控制功能以及 SMBus 訪(fǎng)問(wèn)板載電壓和溫度監測傳感器,可理想適用于企業(yè) IT 和數據中心等應用。BittWare IA-220-U2 功能方塊圖和主要特性如圖 5 所示。

圖片.png
 
圖五 : BittWare IA-220-U2 功能方塊圖和特性。(source:BittWare)

IA-220-U2 設計用于在大容量應用中執行各種加速任務(wù),包括算法推理、壓縮、加密和散列(hashing)、影像搜索和數據庫分類(lèi)以及重復數據刪除等。

使用 BittWare IA-220-U2 實(shí)現 CSP
BittWare IA -220-U2 可以使用 Eideticom 的 NoLoad IP 作為預配置解決方案提供?;蛘?,它可以為客制化應用進(jìn)行使用者程序設計。

透過(guò)提供包含 PCIe 驅動(dòng)器、電路板監控設備以及電路板庫的 SDK,BittWare可用來(lái)支持客制開(kāi)發(fā)??梢允褂肐ntel Quartus Prime Pro 和高級綜合工具鏈以及設計流程來(lái)執行 FPGA 應用開(kāi)發(fā)。

本文引用地址:http://dyxdggzs.com/article/202206/435607.htm

圖片.png 
圖六 : Eideticom NoLoad IP 硬件特性。(來(lái)源:BittWare)

Eideticom 的 NoLoad IP 包括一個(gè)預配置即插即用解決方案,該解決方案采用基于 BittWare U.2 模塊的整合軟件堆棧,還提供一組硬件加速計算儲存服務(wù) (CSS),在圖 6 中以橙色突出顯示。


圖片.png
 
圖七 : Eideticom 的 NoLoad IP 軟件堆棧。(source:BittWare)

圖七 展示了 NoLoad IP 軟件組件,其中包括內核空間堆棧文件系統和使用 NoLoad CSS 的 NVMe 驅動(dòng)器,以及面向具體應用的使用者空間 Libnoload。

Eideticom NoLoad CPU 不可知解決方案卸除功能將服務(wù)質(zhì)量 (QoS) 提高了 40 倍,并還有較低擁有成本和更低功耗優(yōu)勢。

卸除計算密集型任務(wù)可提高通量
使用基于 NVMe 計算儲存架構可在大型數據處理應用中提供更高性能并使用更少功率。這種架構透過(guò)使用基于 FPGA 的計算儲存處理器來(lái)執行計算密集型任務(wù),降低了將資料從儲存點(diǎn)傳輸到處理器(并返回)的要求。在 NVMe NAND 閃存數組上處理點(diǎn)附近儲存數據可以節省能源,同時(shí)還可以減少延遲和所需帶寬。



評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>