<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 電源與新能源 > 設計應用 > 云中的機器學(xué)習:FPGA 上的深度神經(jīng)網(wǎng)絡(luò )

云中的機器學(xué)習:FPGA 上的深度神經(jīng)網(wǎng)絡(luò )

作者: 時(shí)間:2018-08-14 來(lái)源:網(wǎng)絡(luò ) 收藏

本文引用地址:http://dyxdggzs.com/article/201808/386778.htm

因此,很有必要采用并行計算。有很多方法可將實(shí)現過(guò)程并行化。圖 6 給出了其中一種。在這里,將 11x11 的權值矩陣與一個(gè) 11x11 的輸入特征圖并行求卷積,以產(chǎn)生一個(gè)輸出值。這個(gè)過(guò)程涉及 121 個(gè)并行的乘法-累加運算。根據 的可用資源,我們可以并行對 512 抑或 768 個(gè)值求卷積。

為了進(jìn)一步提升吞吐量,我們可以將實(shí)現過(guò)程進(jìn)行流水線(xiàn)化。流水線(xiàn)能為需要一個(gè)周期以上才能完成的運算實(shí)現更高的吞吐量,例如浮點(diǎn)數乘法和加法。通過(guò)流水線(xiàn)處理,第一個(gè)輸出的時(shí)延略有增加,但每個(gè)周期我們都可獲得一個(gè)輸出。

使用 AuvizDNN 在 上實(shí)現的完整 CNN 就像從 C/C++ 程序中調用一連串函數。在建立對象和數據容器后,首先通過(guò)函數調用來(lái)創(chuàng )建每個(gè)卷積層,然后創(chuàng )建致密層,最后是創(chuàng )建 softmax 層,如圖 4 所示。

圖 4 - 實(shí)現 CNN 時(shí)的函數調用順序。

圖 5 – 使用 AuvizDNN 創(chuàng )建 AlexNet 的 L1 的代碼片段。

圖 6 – AlexNets 的性能因 類(lèi)型不同而不同。

AuvizDNN 是 Auviz Systems 公司提供的一種函數庫,用于在 FPGA 上實(shí)現 CNN。該函數庫提供輕松實(shí)現 CNN 所需的所有對象、類(lèi)和函數。用戶(hù)只需要提供所需的參數來(lái)創(chuàng )建不同的層。例如,圖 5 中的代碼片段顯示了如何創(chuàng )建 AlexNet 中的第一層。

AuvizDNN 提供配置函數,用以創(chuàng )建 CNN 的任何類(lèi)型和配置參數。AlexNet 僅用于演示說(shuō)明。CNN 實(shí)現內容作為完整比特流載入 FPGA 并從 C/C++ 程序中調用,這使開(kāi)發(fā)人員無(wú)需運行實(shí)現軟件即可使用 AuvizDNN。

FPGA 具有大量的查找表 (LUT)、DSP 模塊和片上存儲器,因此是實(shí)現深度 CNN 的最佳選擇。在數據中心,單位功耗性能比原始性能更為重要。數據中心需要高性能,但功耗要在數據中心服務(wù)器要求限值之內。

像賽靈思 Kintex® UltraScale™ 這樣的 FPGA 器件可提供高于 14 張圖像/秒/瓦特的性能,使其成為數據中心應用的理想選擇。圖 6 介紹了使用不同類(lèi)型的 FPGA 所能實(shí)現的性能。

一切始于 c/c++

卷積神經(jīng)網(wǎng)絡(luò )備受青睞,并大規模部署用于處理圖像識別、自然語(yǔ)言處理等眾多任務(wù)。隨著(zhù) CNN 從高性能計算應用 (HPC) 向數據中心遷移,需要采用高效方法來(lái)實(shí)現它們。

FPGA 可高效實(shí)現 CNN。FPGA 的具有出色的單位功耗性能,因此非常適用于數據中心。

AuvizDNN 函數庫可用來(lái)在 FPGA 上實(shí)現 CNN。AuvizDNN 能降低 FPGA 的使用復雜性,并提供用戶(hù)可從其 C/C++ 程序中調用的簡(jiǎn)單函數,用以在 FPGA 上實(shí)現加速。使用 AuvizDNN 時(shí),可在 AuvizDNN 庫中調用函數,因此實(shí)現 FPGA 加速與編寫(xiě) C/C++ 程序沒(méi)有太大區別。


上一頁(yè) 1 2 下一頁(yè)

關(guān)鍵詞: FPGA

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>