<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 工控自動(dòng)化 > 設計應用 > 如何用FPGA實(shí)現算法的硬件加速

如何用FPGA實(shí)現算法的硬件加速

作者：時(shí)間：2008-04-24 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

節數)，它可返回所計算的CRC值(余數)。盡管該函數的自變量是一些字節，但計算要逐位來(lái)執行。該算法并不高效，因為所有操作(與、移位、異或和循環(huán)控制)都必須逐位地執行。

　　列表1：逐位執行的CRC算法C代碼。

　　/*

　　* The width of the CRC calculation and result.

　　* Modify the typedef for a 16or32-bit CRC standard.

　　*/

　　typedef unsigned char crc;

　　#define WIDTH (8 * sizeof(crc))

　　#define TOPBIT (1 (WIDTH - 1))

　　crc crcSlow(unsigned char const message[], int nBytes)

　　{

　　crc remainder = 0;

　　/*

　　* Perform modulo-2 division, a byte at a time.

　　*/

　　for (int byte = 0; byte nBytes; ++byte)

　　{

　　/*

　　* Bring the next byte into the remainder.

　　*/

　　remainder ^= (message[byte] (WIDTH - 8));

　　/*

　　* Perform modulo-2 division, a bit at a time.

　　*/

　　for (unsigned char bit = 8; bit > 0; "bit)

　　{

　　/*

　　* Try to divide the current data bit.

　　*/

　　if (remainder TOPBIT)

　　{

　　remainder = (remainder 1) ^ POLYNOMIAL;

　　}

　　else

　　{

　　remainder = (remainder 1);

　　}

　　}

　　}

　　/*

　　* The final remainder is the CRC result.

　　*/

　　return (remainder);

　　}

　　1.傳統的軟件優(yōu)化

　　

　　

　　圖3：帶CRC外圍電路和DMA的系統模塊示意圖。

　　讓我們看一下如何利用傳統的軟件技巧來(lái)優(yōu)化CRC算法。因為CRC操作中的一個(gè)操作數，即多項式(除數)是常數，字節寬CRC操作的所有可能結果都可以預先計算并存儲在一個(gè)查找表中。這樣，通過(guò)一個(gè)讀查找表動(dòng)作就可讓操作按逐個(gè)字節執行下去。

　　采用這一算法時(shí)，需要將這些預先計算好的值存儲在存儲器中。選擇ROM或RAM都可以，只要在啟動(dòng)CRC計算之前將存儲器初始化就行。查找表有256個(gè)字節，表中每個(gè)字節位置包含一個(gè)CRC結果，共有256種可能的8位消息(與多項式大小無(wú)關(guān))。

　　列表2示出了采用查找表方法的C代碼，包括生成查找表crcInit()中數值的代碼。

　　列表2：采用查找表方法的CRC算法C代碼。

　　crc crcTable[256];

　　void crcInit(void)

　　{

　　crc remainder;

　　/*

　　* Compute the remainder of each possible dividend.

　　*/

　　for (int dividend = 0; dividend 256; ++dividend)

　　{

　　/*

　　* Start with the dividend followed by zeros.

　　*/

　　remainder = dividend (WIDTH - 8);

　　/*

　　* Perform modulo-2 division, a bit at a time.

　　*/

　　for (unsigned char bit = 8; bit > 0; "bit)

　　{

　　/*

　　* Try to divide the current data bit.

　　*/

　　if (remainder TOPBIT)

　　{

　　remainder = (remainder 1) ^ POLYNOMIAL;

　　}

　　else

　　{

　　remainder = (remainder 1);

　　}

　　}

　　/*

　　* Store the result into the table.

　　*/

　　crcTable[dividend] = remainder;

　　}

　　} /* crcInit() */

　　crc crcFast(unsigned char const message[], int nBytes)

　　{

　　unsigned char data;

　　crc remainder = 0;

　　/*

　　* Divide the message by the polynomial, a byte at a time.

　　*/

　　for (int byte = 0; byte nBytes; ++byte)

　　{

　　data = message[byte] ^ (remainder >> (WIDTH - 8));

　　remainder = crcTable[data] ^ (remainder 8);

　　}

　　/*

　　* The final remainder is the CRC.

　　*/

　　return (remainder);

　　} /* crcFast() */

　　整個(gè)計算減少為一個(gè)循環(huán)，每字節(不是每位)有兩個(gè)異或、兩個(gè)移位操作和兩個(gè)裝載指令?；旧?，這里是用查找表的存儲空間來(lái)?yè)Q取速度。該方法比逐位計算的方法要快9.9倍，這一提高對某些應用已經(jīng)足夠。如果需要更高的性能，可以嘗試編寫(xiě)匯編代碼或增加查找表容量以擠出更多性能來(lái)。但是，如果需要20、50甚至500倍的性能提高，就要考慮采用硬件加速來(lái)實(shí)現該算法了。

　　

　　

　　表1：各種規模的數據模塊下CRC算法測試比較結果。

　　2.采用定制指令方法

　　CRC算法由連續的異或和移位操作構成，用很少的邏輯即可在硬件中簡(jiǎn)單實(shí)現。由于這一硬件模塊僅需幾個(gè)周期來(lái)計算CRC，采用定制指令來(lái)實(shí)現CRC計算要比采用外圍電路更好。此外，無(wú)須涉及系統中任何其它外圍電路或存儲器。僅需要一個(gè)微處理器來(lái)支持定制指令即可，一般是指可配置微處理器。

　　當在硬件中實(shí)現時(shí)，算法應該每次執行16或32位計算，這取決于所采用的CRC標準。如果采用CRC-CCITT標準(16位多項式)，最好每次執行16位計算。如果使用8位微處理器，效率可能不太高，因為裝載操作數值及返回CRC值需要額外的周期。圖2示出了用硬件實(shí)現16位CRC算法的內核。

　　信號msg(15..0)每次被移入異或/移位硬件一位。列表3示出了在64KB數據模塊上計算CRC的一些C代碼例子。該實(shí)例是針對Nios嵌入式處理器。

　　列表3：采用定制指令的CRC計算C代碼。

　　unsigned short crcCompute(unsigned short *data_block, unsigned int nWords)

　　{

　　unsigned short* pointer;

　　unsigned short word;

　　/*

　　* initialize crc reg to 0xFFFF

　　*/

　　word = nm_crc (0xFFFF, 1); /* nm_crc() is the CRC custom instruction */

　　/*

　　* calculate CRC on block of data

　　* nm_crc() is the CRC custom instruction

　　*

　　*/

　　for (pointer = data_block; pointer (data_block + nWords); pointer ++)

　　word = nm_crc(*pointer, 0) return (word);

　　}

　　int main(void)

　　{

　　#define data_block_begin (na_onchip_memory)

　　#define data_block_end (na_onchip_memory + 0xffff)

　　unsigned short crc_result;

　　unsigned int data_block_length = (unsigned short *)data_block_end - (unsigned short

　　*)data_block_begin + 1;

　　crc_result = crcCompute((unsigned short *)data_block_begin, data_block_length);

　　}

　　采用定制指令時(shí)，用于計算CRC值的代碼是一個(gè)函數調用，或宏。當針對Nios處理器實(shí)現定制指令時(shí)，系統構建工具會(huì )生成一個(gè)宏。在本例中為nm_crc()，可用它來(lái)調用定制指令。

　　在啟動(dòng)CRC計算之前，定制指令內的CRC寄存器需要先初始化。裝載初始值是CRC標準的一部分，而且每種CRC標準都不一樣。接著(zhù)，循環(huán)將為數據模塊中的每16位數據調用一次CRC定制指令。這種定制指令實(shí)現方式要比逐位實(shí)現的方法快27倍。

　　3.CRC外圍電路方法

　　如果將CRC算法作為硬件外圍電路來(lái)實(shí)現，并利用DMA將數據從存儲器轉移到外圍電路，這樣還可以進(jìn)一步提高速度。這種方法將省去處理器為每次計算而裝載數據所需要的額外周期。DMA可在此外圍電路完成前一次CRC計算的時(shí)鐘周期內提供新的數據。圖3示出了利用DMA、CRC外圍電路來(lái)實(shí)現加速的系統模塊示意圖。

　　在64KB數據模塊上，利用帶DMA的定制外圍電路可獲得比逐位計算的純軟件算法快500倍的性能。要知道，隨著(zhù)數據模塊規模的增加，使用DMA所獲得的性能也隨之提高。這是因為設置DMA僅需很少的開(kāi)銷(xiāo)，設置之后DMA運行得特別快，因為每個(gè)周期它都可以傳遞數據。因此，若只有少數字節的數據，用DMA并不劃算。

　　這里所討論的所有采用CRC-CCITT標準(16位多項式)的算法都是在A(yíng)ltera Stratix FPGA的Nios處理器上實(shí)現的。表1示出了各種數據長(cháng)度的測試比較結果，以及大致的硬件使用情況(FPGA中的存儲器或邏輯單元)。

　　可以看出，算法所用的硬件越多，算法速度越快。這是用硬件資源來(lái)?yè)Q取速度。

　　FPGA的優(yōu)點(diǎn)

　　當采用基于FPGA的嵌入式系統時(shí)，在設計周期之初不必為每個(gè)模塊做出用硬件還是軟件的選擇。如果在設計中間階段需要一些額外的性能，則可以利用FPGA中現有的硬件資源來(lái)加速軟件代碼中的瓶頸部分。由于FPGA中的邏輯單元是可編程的，可針對特定的應用而定制硬件。因此，僅使用所需要的硬件即可，而不必做出任何板級變動(dòng)(前提是FPGA中的邏輯單元足夠用)。設計者不必轉換到

fpga相關(guān)文章:fpga是什么

上一頁(yè) 1 2 3 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 實(shí)現算法 CRC 硬件加速 FPGA 查找表 typedef const 算術(shù)邏輯單元 ALU 狀態(tài)寄存器

評論

相關(guān)推薦

用C/C++語(yǔ)言開(kāi)發(fā)大規模FPGA [轉載于www.fpga.com.cn]

xiaohua | 2002-09-24

高速ADC與內置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

采用創(chuàng )新的FPGA 器件來(lái)實(shí)現更經(jīng)濟且更高能效的大模型推理解決方案

嵌入式系統 Achronix FPGA | 2024-06-18

國產(chǎn)28納米FPGA流片

嵌入式系統 FPGA EDA 芯片 | 2024-05-31

FPGA比單片機厲害嗎？

嵌入式系統 FPGA 單片機 | 2024-06-13

LatticeECP3設計的視頻協(xié)議板電路圖-FPGA配置

設計方案 LatticeECP3 設計視頻協(xié)議電路圖 -FPGA | 2011-06-27

FPGA是實(shí)現敏捷、安全的工業(yè)4.0發(fā)展的關(guān)鍵

嵌入式系統 FPGA 工業(yè)4.0 Lattice 萊迪思 | 2024-05-06

視頻協(xié)議板-FPGA配置基于LatticeECP3的設計

設計方案視頻協(xié)議 -FPGA 配置基于 LatticeECP3 | 2014-05-20

9種單片機常用的軟件架構

嵌入式系統 PCB FPGA 架構 | 2024-05-21

利用強大的軟件設計工具為FPGA開(kāi)發(fā)者賦能

嵌入式系統軟件設計工具 FPGA 萊迪思 | 2024-07-17

iCE40 LP/HX系列FPGA：萊迪思的創(chuàng )新可編程解決方案

嵌入式系統 iCE40 LP/HX FPGA 萊迪思可編程解決方案 | 2024-06-07

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

實(shí)時(shí)的噪聲源定位系統

視頻 NI LabVIEW FPGA | 2009-03-25

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統萊迪思 FPGA 小型FPGA | 2024-07-23

LabVIEW 8.20技術(shù)資料大全簡(jiǎn)介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

s3c2410+fpga 做視頻無(wú)線(xiàn)傳輸

herbertwj | 2004-08-15

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實(shí)現創(chuàng )新

視頻 Altera FPGA ASIC | 2009-07-13

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

Altera的FPGA下載常見(jiàn)問(wèn)題經(jīng)驗小結

資源下載 Altera FPGA 常見(jiàn)問(wèn)題經(jīng)驗 | 2007-12-13

基于FPGA的數字信號處理--什么是定點(diǎn)數？

嵌入式系統 FPGA 數字信號定點(diǎn)數 | 2024-05-11

LabVIEW FPGA 模塊簡(jiǎn)介

視頻 NI LabVIEW FPGA | 2009-04-01

基于SD7502構成的FPGA-ASK電路圖

設計方案基于 SD7502 構成 FPGA-ASK 電路圖 | 2011-07-13

Altera公司cyclone系列FPGA-1C6電路圖

設計方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

ALTERA的PCI_IP Core問(wèn)答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

CRC算法和c語(yǔ)言實(shí)現

資源下載 CRC 算法與C語(yǔ)言 | 2007-12-09

基于FPGA的鎖相環(huán)位同步提取電路

設計方案電子電路圖，FPGA 鎖相環(huán) | 2012-07-27

3-DES算法的FPGA高速實(shí)現(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

萊迪思推出全新安全控制FPGA系列產(chǎn)品，具備先進(jìn)的加密敏捷性和硬件可信根

嵌入式系統萊迪思安全控制 FPGA 加密敏捷性硬件可信根 | 2024-06-27

FPGA如何同DDR3存儲器進(jìn)行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>