<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 網(wǎng)絡(luò )與存儲 > 設計應用 > 存儲新時(shí)代:利用RISC-V和內存結構實(shí)現開(kāi)放式計算

存儲新時(shí)代:利用RISC-V和內存結構實(shí)現開(kāi)放式計算

作者: 時(shí)間:2018-07-10 來(lái)源:電子產(chǎn)品世界 收藏

  前言

本文引用地址:http://dyxdggzs.com/article/201807/383021.htm

  在過(guò)去的幾年里,我們目睹了數據的一系列巨大變化,包括數據如何被生成、處理以及進(jìn)一步利用以獲取額外的價(jià)值和智能,而這些變化都受到以深度學(xué)習和神經(jīng)網(wǎng)絡(luò )應用為基礎的新興計算模式所影響。這種深刻的變化始于數據中心,其利用深度學(xué)習技術(shù)來(lái)提供對海量數據的洞察,主要用于分類(lèi)或識別圖像、支持自然語(yǔ)言處理或語(yǔ)音處理,或者理解、生成或成功學(xué)習如何玩復雜的策略游戲。這種變化催生了一批專(zhuān)門(mén)針對這些類(lèi)別的問(wèn)題而設計的高功效計算設備(基于GP-GPU和),后來(lái)還產(chǎn)生了可完全定制的ASIC,進(jìn)一步加速并提高了基于深度學(xué)習的系統的計算能力。

  大數據和快速數據

  大數據應用采用專(zhuān)門(mén)的GP-GPU、和ASIC處理器透過(guò)深度學(xué)習技術(shù)來(lái)分析大型數據集,并揭示趨勢、模式和關(guān)聯(lián)性,從而實(shí)現圖像識別、語(yǔ)音識別等功能。因此,大數據是基于過(guò)去的信息或常駐在云端的靜止數據。大數據分析的一個(gè)常用的功能是執行特定任務(wù)“訓練過(guò)的”神經(jīng)網(wǎng)絡(luò ),例如識別和標記圖像或視頻序列中的所有面部,語(yǔ)音識別也展示了神經(jīng)網(wǎng)絡(luò )的強大功能。

  這種任務(wù)最好由專(zhuān)門(mén)的引擎(或推理引擎)來(lái)執行,這種引擎直接駐留在邊緣設備上并由快速數據應用程序(圖1)來(lái)引導。通過(guò)在邊緣設備上處理本地所捕獲的數據,快速數據能夠利用來(lái)自大數據的算法提供實(shí)時(shí)決策和結果。大數據提供了從“過(guò)去發(fā)生了什么”到“將來(lái)可能會(huì )發(fā)生什么”所演繹出的洞察(預測分析),而快速數據則提供了能夠改善業(yè)務(wù)決策、運營(yíng)并減少低效情形的實(shí)時(shí)行動(dòng),所以這一定會(huì )影響最終結果。這些方法可以適用于各種邊緣和存儲設備,例如照相機、智能手機和固態(tài)硬盤(pán)。

  在數據上進(jìn)行計算

  新的工作負載基于兩種場(chǎng)景:(1)針對特定工作負載(例如圖像或語(yǔ)音識別)訓練大型神經(jīng)網(wǎng)絡(luò );以及(2)在邊緣設備上應用經(jīng)過(guò)訓練的(或“適合的”)神經(jīng)網(wǎng)絡(luò )。兩種工作負載都需要大規模并行的數據處理,其中包括大矩陣的乘法和卷積。這些計算功能的最佳實(shí)施方式需要在大矢量或數據陣列上運行的矢量指令。就是一種非常適合于此類(lèi)型應用的架構和生態(tài)系統,因為它提供了一套由開(kāi)源軟件支持的標準化過(guò)程,使得開(kāi)發(fā)人員能夠完全自由地采用、修改甚至添加專(zhuān)有矢量指令。圖1中概述了一些顯而易見(jiàn)的計算架構機會(huì )。

  移動(dòng)數據

  快速數據和邊緣計算的出現產(chǎn)生了一個(gè)實(shí)際的后果,即:與云端之間來(lái)回移動(dòng)所有數據進(jìn)行計算分析并不是一件有效率的事。首先,在移動(dòng)網(wǎng)絡(luò )和以太網(wǎng)中進(jìn)行遠距離傳輸時(shí),它涉及到相對較大的數據延遲傳輸,這對于必須實(shí)時(shí)操作的圖像識別或語(yǔ)音識別應用而言并不是理想的。其次,在邊緣設備上進(jìn)行計算需要更易于伸縮的架構,其中,圖像和語(yǔ)音處理或者在SSD上進(jìn)行的內存計算操作都可用一種伸縮的方式來(lái)進(jìn)行。采用這種方式,每一臺新增的邊緣設備都會(huì )帶來(lái)所需要的增量計算能力,對數據移動(dòng)方式和時(shí)間進(jìn)行優(yōu)化是這種架構可伸縮性的一項關(guān)鍵因素。

  圖1:大數據、快速數據和機會(huì )

  在圖1a中,云數據中心服務(wù)器利用在大型大數據集上訓練的深度學(xué)習神經(jīng)網(wǎng)絡(luò )來(lái)執行機器學(xué)習的功能。在圖1b中,邊緣設備中的安全攝像機采用經(jīng)過(guò)大數據訓練的推理引擎來(lái)實(shí)時(shí)識別圖像(快速數據)。在圖1c中,智能固態(tài)硬盤(pán)設備采用推理引擎進(jìn)行數據識別和分類(lèi),從而有效地利用了此設備的帶寬。圖1展示了RISC-V內核的潛在機會(huì ),它可以自由地添加專(zhuān)有的及未來(lái)標準化的矢量指令,這些指令對于處理深度學(xué)習和推理技術(shù)相當有效。

  另一個(gè)類(lèi)似且重要的趨勢是大數據端和云端上數據的移動(dòng)及訪(fǎng)問(wèn)方式(圖2)。傳統的計算機體系結構(圖2a)采用慢速外圍總線(xiàn),該總線(xiàn)連接到許多其他設備(例如,專(zhuān)用機器學(xué)習加速器、圖形卡、高速固態(tài)硬盤(pán)、智能網(wǎng)絡(luò )控制器,等等)。低速總線(xiàn)會(huì )影響設備的利用率,因為它限制了總線(xiàn)本身、主CPU以及主要的潛在持久內存之間的通信能力。這些新型計算設備也不可能在它們之間或與主CPU共享內存,從而導致在慢速總線(xiàn)上進(jìn)行徒勞且受限制的數據移動(dòng)。

  關(guān)于如何改善不同計算設備(例如CPU和計算機及網(wǎng)絡(luò )加速器)之間的數據移動(dòng),以及如何在內存或快速存儲中訪(fǎng)問(wèn)數據,出現了幾個(gè)重要的行業(yè)趨勢。這些新趨勢集中在開(kāi)放標準化工作上,能夠提供更快、更低延遲的串行結構以及更智能的邏輯協(xié)議,從而實(shí)現對共享內存的一致訪(fǎng)問(wèn)。

  新一代以數據為中心的計算

  未來(lái)的架構將需要部署開(kāi)放接口,以連接到持久性?xún)却嬉约敖尤胗嬎慵铀倨鞑⒅С指咚倬彺嬉恢滦缘目焖倏偩€(xiàn)(例如TileLink、RapidIO?、OpenCAPI?和Gen-Z),以期大幅度提高性能,而且使所有設備共享內存并減少不必要的數據移動(dòng)。

  圖2:計算體系結構中的數據移動(dòng)和訪(fǎng)問(wèn)

  在圖2a中,傳統的計算體系結構由于把一條慢速外設總線(xiàn)用于快速存儲器及計算加速設備,其能力已達到其極限。在圖2b中,未來(lái)的計算體系結構采用了開(kāi)放接口,能夠為平臺上所有的計算資源提供統一并支持高速緩存一致性的訪(fǎng)問(wèn)方式來(lái)訪(fǎng)問(wèn)共享持久內存,(這稱(chēng)為以數據為中心的體系結構)。在圖2c中,所部署的設備能夠使用相同的共享內存,從而減少了不必要的數據復制。

  CPU 外圍核心及網(wǎng)絡(luò )接口控制器的作用將成為支持數據移動(dòng)的關(guān)鍵因素。CPU外圍核心組件必須支持密鑰內存和永久內存接口(例如NVDIMM-P),也必須支持駐留在CPU附近的內存。還需要實(shí)施面向計算加速器、智能網(wǎng)絡(luò )和遠程持久內存的智能快速總線(xiàn)。這種總線(xiàn)上的任何設備(例如CPU、通用或專(zhuān)用計算加速器、網(wǎng)絡(luò )適配器、存儲器或內存)都可以包含其自己的計算資源并具有訪(fǎng)問(wèn)共享內存的能力(圖2b和圖2c)。

  RISC-V技術(shù)正是優(yōu)化數據移動(dòng)的關(guān)鍵推動(dòng)因素,因為它能夠在所有的計算加速器設備上針對新的機器學(xué)習工作負載來(lái)執行矢量指令。它實(shí)現了多種開(kāi)源CPU技術(shù),能夠支持開(kāi)放內存和智能總線(xiàn)接口;且實(shí)現了以數據為中心具有一致性共享內存的體系結構。

  利用RISC-V解決挑戰

  大數據和快速數據為未來(lái)的數據移動(dòng)帶來(lái)了挑戰,也為RISC-V指令集架構(ISA)鋪平了道路。這種架構開(kāi)放的、模塊化的方法非常適合用作以數據為中心的計算體系結構的基礎。它提供了以下功能:

  · 擴展邊緣計算設備的計算資源

  · 添加新的指令,例如用于機器學(xué)習工作負載的矢量指令

  · 尋找非常接近于存儲器和內存介質(zhì)的小型計算內核

  · 支持新型計算范式以及模塊化芯片設計方法

  · 支持新型以數據為中心的體系結構,其中所有的處理單元都可以透過(guò)一致的方式訪(fǎng)問(wèn)共享的持久內存,從而優(yōu)化數據移動(dòng)

  RISC-V由超過(guò)100個(gè)組織機構的眾多成員共同開(kāi)發(fā),這其中包含一個(gè)由軟件和硬件創(chuàng )新者組成的協(xié)作性社區。這些創(chuàng )新者能夠對ISA進(jìn)行改編,使其適應特定的目的或項目。任何加入該組織的人都可以根據一份“Berkeley Software Distribution”(BSD軟件發(fā)布)許可證來(lái)設計、制造和/或銷(xiāo)售RISC-V芯片和軟件。

  結語(yǔ)

  為了實(shí)現其價(jià)值和可能性,數據需要捕獲、保存、訪(fǎng)問(wèn)并轉換,以發(fā)揮其全部潛力。含有大數據和快速數據應用的環(huán)境已經(jīng)使通用計算體系結構的處理能力相形見(jiàn)絀。未來(lái)以數據為中心的極端應用將需要針對特定用途設計的處理能力,以便以開(kāi)放的方式支持數據資源的獨立擴展。

  擁有一套以在持久內存中存儲的數據為中心的通用開(kāi)放計算機體系結構,同時(shí)又能夠讓所有的設備發(fā)揮一定的計算作用,這是由新類(lèi)型機器學(xué)習計算工作負載所推動(dòng)的這些新型可擴展體系結構得以出現的關(guān)鍵因素??缭皆贫思斑吘壴O備各個(gè)部分的下一代應用都需要這種新型的低能耗處理方式,因為專(zhuān)門(mén)的計算加速處理器將能夠專(zhuān)注于處理其手邊的任務(wù),從而能夠減少來(lái)回移動(dòng)數據所浪費的時(shí)間,或者能夠執行與數據無(wú)關(guān)的額外計算。通過(guò)發(fā)揮數據的力量、潛力和可能性,人類(lèi)、社會(huì )以及我們的星球都能夠蓬勃發(fā)展。



關(guān)鍵詞: RISC-V FPGA

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>