<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > FPGA 解決方案和標準控制器內核比較

FPGA 解決方案和標準控制器內核比較

作者：時(shí)間：2018-09-10 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

如果在兩者之間沒(méi)有使用 FSL總線(xiàn)的情況下添加這個(gè)IP，您必須對項目的MHS文件進(jìn)行如下修改：
BEGIN microblaze
...
PARAMETER C_FSL_LINKS = 1
...
PORT FSL0_S_EXISTS = net_vcc
PORT FSL0_S_DATA = FSL0_S_DATA
PORT FSL0_M_DATA = FSL0_M_DATA
PORT FSL0_M_WRITE = FSL0_M_EXISTS
PORT FSL0_M_Full = net_gnd
END
BEGIN fsl_bitrev
PARAMETER INSTANCE = fsl_bitrev_0
PARAMETER HW_VER = 1.00.a
PORT FSL_S_DATA = FSL0_M_DATA
PORT FSL_S_EXISTS = FSL0_M_EXISTS
PORT FSL_M_Data = FSL0_S_DATA
PORT FSL_M_Full = net_gnd
PORT FSL_Clk = clk_50_0000MHz
END

本文引用地址：http://dyxdggzs.com/article/201809/388779.htm

　　現在效率顯著(zhù)提高。硬核僅在兩個(gè)周期內可完成位反轉操作：一個(gè)周期用于把數據寫(xiě)入IP，另一個(gè)周期則負責讀回結果。處理2萬(wàn)個(gè)位反轉操作現在只需0.8ms。

　　與最初采用的算法相比，效率提升了110倍。與效率最高的最新軟件算法相比，此算法仍使系統性能提升了11倍。

　　當然，本例只有在您的CPU不提供位反轉尋址功能的情況下才有效。大多數 DSP都有此功能，但大多數微控制器都不具備這個(gè)功能。具備增加這個(gè)功能的特性可大幅度提升這種算法的處理速度。

　　雖然修改不大，但收效十分明顯。我們甚至將代碼壓縮到兩個(gè)字大小。當然，現在硬件要求增加一些芯片。不過(guò)以此為代價(jià)獲得比任何標準微控制器更高的速度，是值得的。

　案例2：高速浮點(diǎn)性能

　　現在我們給出另一個(gè) MicroBlaze算法加速示例。一個(gè)客戶(hù)聲稱(chēng)他的浮點(diǎn)處理在MicroBlaze系統上運行非常慢。他使用的算法可采用簡(jiǎn)單的環(huán)路同時(shí)得出幾個(gè)結果。

for (i=0;i512;i++) {
f_sum += farr[i];
　　　f_sum_prod += farr[i] * farr[i];
f_sum_tprod += farr[i] *
farr[i] * farr[i];
　　f_sqrt + =
sqrt(farr[i]);
　　if (min_f > farr[i]) { min_f =
farr[i]; }
　　if (max_f farr[i]) { max_f =
farr[i]; }
}

　　所有數值均是單精度浮點(diǎn)值。我們首先想到的是最基礎的一個(gè)問(wèn)題：浮點(diǎn)單元 (FPU) 激活了嗎?檢查項目設置后，我們發(fā)現FPU仍然處于未啟用狀態(tài)。這就是為什么永遠無(wú)法計算出這幾個(gè)數的原因。FPU可在 MicroBlaze屬性設置中加以激活。

　　FPU支持共有兩種。我們也選擇擴展FPU (Extended FPU)來(lái)支持求平方根運算?，F在，在50MHz 的MicroBlaze上需要 1,108,685個(gè)周期才能完成 512個(gè)值的全部循環(huán)。查看生成的匯編程序代碼后，可以了解到創(chuàng )建平方根是仍然在使用數學(xué)庫(Math-lib)功能。其在數學(xué)功能中的定義為：

　　double sqrt(double);

　　不過(guò)客戶(hù)使用平方根函數僅為處理浮點(diǎn)數值。因此，MicroBlaze FPU定義了一個(gè)新的函數來(lái)取代原來(lái)的函數，解決這個(gè)問(wèn)題：

　　float sqrtf(float);

　　把表達式f_sqrt += sqrt(farr[i])變?yōu)閒_sqrt += sqrtf(farr[i])，就會(huì )調用MicroBlaze內部的FPU內部平方根功能?，F在執行代碼只需要35,336個(gè)周期。特別是與第一個(gè)根本沒(méi)有使用FPU的方案相比，我們再次通過(guò)小小的調整就實(shí)現了31倍的提升。在相同的執行時(shí)間內，可能需要大約1.5GHz的CPU才能給出上述這些結果。

　不過(guò)客戶(hù)仍不滿(mǎn)意，客戶(hù)要求更高的速度。在這種情況下，把算法從浮點(diǎn)運算變?yōu)楣厅c(diǎn)運算并不適合。因此，我們開(kāi)發(fā)了一款新型專(zhuān)用硬件加速器(新型FSL IP)來(lái)加快對循環(huán)的處理。

　　新的FSL IP使用CORE Generator模塊浮點(diǎn)_v4_0來(lái)為4x ADD、2x MUL、1x GREATER、1x LESS和1x SQRT等操作創(chuàng )建9個(gè)示例。所有這些示例都可以實(shí)體化，并對相同的輸入數據進(jìn)行完全并行處理(圖2)。

　　FSL IP中實(shí)例的創(chuàng )建帶有部分時(shí)延，但吞吐率僅為1。這要求為加速器內部的控制器硬件準備更多的芯片，不過(guò)這樣可以在每個(gè)時(shí)鐘周期內向協(xié)處理器提供新數據。

　　在取回結果前，只有在處理循環(huán)末端才需要增加周期。

　　我們采用直連方式把MicroBlaze連接到FSP IP時(shí)不需要FIFO。傳輸的所有數據都將緩存在IP內，并隨即加以處理。

　　從FSL IP返回到MicroBlaze的連接是使用FSL總線(xiàn)創(chuàng )建的。由于我們必須發(fā)回一些結果，因而這更加容易實(shí)現，而且可以更加簡(jiǎn)單地在IP內完成。部分CoreGen模塊有一些已被添加到執行時(shí)間中的時(shí)延，并被getfsl()調用完全覆蓋。MicroBlaze只需要等到所有結果都存入FSL總線(xiàn)FIFO。不過(guò)，只要數據率是1，即可完全實(shí)現所要求的吞吐率。

　　FSL總線(xiàn)的額外延遲僅會(huì )占用為數不多的一些周期。使用FSL硬件加速器的C代碼如下：for (i=0;i512;i++) {
putfsl(farr[i],fsl0_id);
}
// get the min,max values:
getfsl(min_f,fsl0_id);
getfsl(max_f,fsl0_id);
// get the sum and products:
getfsl(f_sum,fsl0_id);
getfsl(f_sum_prod,fsl0_id);
getfsl(f_sum_tprod,fsl0_id);
getfsl(f_sqrt,fsl0_id);

　　算法的最終實(shí)施僅需大約4,630個(gè)周期，而且依然是全浮點(diǎn)實(shí)施。

　　硬件需要本來(lái)應該用于實(shí)施硬件加速器的更多芯片才能并行計算出所有結果。不過(guò)與擴展FPU實(shí)施方案相比，我們最終提升了大約7.6倍。否則，如果使用標準處理器來(lái)替換這個(gè)50MHz的處理器，可能需要大約380MHz的CPU才能勝任(假設硬件自帶有浮點(diǎn)平方根函數)。

　　更為顯著(zhù)的是與使用PFU的最初方案，而非平方根函數的對比效果：總體提升了大約239倍。這種效果可能需要12GHz左右的浮點(diǎn)處理器才能實(shí)現。

　　如上述例子所示，有時(shí)候小小的調整就會(huì )顯著(zhù)影響算法的處理效果。實(shí)施這些調整，可以讓您的50MHz MicroBlaze系統與高性能DSP相媲美。

　　首先，找出執行時(shí)間過(guò)長(cháng)的核心算法，然后對其加速——通過(guò)簡(jiǎn)單調整軟件，使用硬件，或使用硬件加速器進(jìn)行更為復雜的調整。如此一來(lái)，您的處理器系統會(huì )強于標準控制器。

上一頁(yè) 1 2 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： FPGA 方案標準比較

評論

相關(guān)推薦

FPGA如何同DDR3存儲器進(jìn)行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

FPGA是實(shí)現敏捷、安全的工業(yè)4.0發(fā)展的關(guān)鍵

嵌入式系統 FPGA 工業(yè)4.0 Lattice 萊迪思 | 2024-05-06

萊迪思推出全新安全控制FPGA系列產(chǎn)品，具備先進(jìn)的加密敏捷性和硬件可信根

嵌入式系統萊迪思安全控制 FPGA 加密敏捷性硬件可信根 | 2024-06-27

ALTERA的PCI_IP Core問(wèn)答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實(shí)現創(chuàng )新

視頻 Altera FPGA ASIC | 2009-07-13

國產(chǎn)28納米FPGA流片

嵌入式系統 FPGA EDA 芯片 | 2024-05-31

CW137／CW237／CW337的標準應用電路

設計方案 CW137 CW237 CW337 標準應用電路 | 2009-07-06

基于FPGA的可編程數字濾波器系統

資源下載 Max FPGA 可編程數字濾波器 | 2007-12-14

LabVIEW FPGA 模塊簡(jiǎn)介

視頻 NI LabVIEW FPGA | 2009-04-01

3-DES算法的FPGA高速實(shí)現(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

東芝NEC將公布DVD新標準抗衡Sony為首的新格式

hpnet | 2002-08-27

由W317L／W317M／W317構成的加保護二極管的標準應用電路

設計方案 W317L W317M 構成保護二極管標準應用電路 | 2009-07-06

iCE40 LP/HX系列FPGA：萊迪思的創(chuàng )新可編程解決方案

嵌入式系統 iCE40 LP/HX FPGA 萊迪思可編程解決方案 | 2024-06-07

實(shí)時(shí)操作系統與通用操作系統的一些比較（轉載）

jackwang | 2002-05-14

最簡(jiǎn)單標準的Li-ion電池用充電器

設計方案最簡(jiǎn)單標準 Li-ion 電池充電器 | 2009-07-06

LabVIEW 8.20技術(shù)資料大全簡(jiǎn)介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

基于FPGA的數字信號處理--什么是定點(diǎn)數？

嵌入式系統 FPGA 數字信號定點(diǎn)數 | 2024-05-11

利用強大的軟件設計工具為FPGA開(kāi)發(fā)者賦能

嵌入式系統軟件設計工具 FPGA 萊迪思 | 2024-07-17

實(shí)時(shí)的噪聲源定位系統

視頻 NI LabVIEW FPGA | 2009-03-25

高速ADC與內置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

采用創(chuàng )新的FPGA 器件來(lái)實(shí)現更經(jīng)濟且更高能效的大模型推理解決方案

嵌入式系統 Achronix FPGA | 2024-06-18

Altera的FPGA下載常見(jiàn)問(wèn)題經(jīng)驗小結

資源下載 Altera FPGA 常見(jiàn)問(wèn)題經(jīng)驗 | 2007-12-13

GPRS網(wǎng)“落地”筆記本電腦市場(chǎng)現商機?

hpnet | 2002-08-05

CD4541構成的0.1C5A標準鎘鎳電池充電電路

設計方案 CD4541 構成 0.1C5A 標準鎘鎳電池充電電 | 2009-07-06

9種單片機常用的軟件架構

嵌入式系統 PCB FPGA 架構 | 2024-05-21

[轉帖]實(shí)時(shí)操作系統與通用操作系統的一些比較

amine | 2002-05-16

可調集成穩壓電源的標準電路(CW117/CW217/CW317)

設計方案可調集成穩壓電源標準電路 CW117 CW217 C | 2009-07-06

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統萊迪思 FPGA 小型FPGA | 2024-07-23

FPGA比單片機厲害嗎？

嵌入式系統 FPGA 單片機 | 2024-06-13

FPGA與ASSP和ASIC競爭

hpnet | 2002-08-26

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>