<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 電源與新能源 > 設計應用 > 一種基于FPGA硬件求解函數的簡(jiǎn)化方法

一種基于FPGA硬件求解函數的簡(jiǎn)化方法

作者：時(shí)間：2018-07-24 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

摘要：本文研究了一種運用FPGA進(jìn)行數據處理的方法，包括：提取輸入數據的高log2M個(gè)比特位的數據，作為高有效位，根據預先設置的目標函數的計算表格，查找所述高有效位對應的目標函數值y(n)以及高有效位+1對應的目標函數值y(n+1);提取輸入數據的剩余比特位數據，作為低有效位，并將所述低有效位與y(n)和y(n+1)的差值相乘，得到偏移值off(n)，將該偏移值與所述高有效位對應的目標函數值y(n)相加，將計算結果作為所述輸入數據對應的目標函數值。本方法具有控制簡(jiǎn)單、結構規則、單運算周期、計算精度較高的特點(diǎn)，適合于FPGA的數據處理實(shí)現。

本文引用地址：http://dyxdggzs.com/article/201807/383564.htm

引言

現場(chǎng)可編程門(mén)陣列(FPGA)芯片在許多領(lǐng)域均有廣泛的應用，尤其是在無(wú)線(xiàn)通信領(lǐng)域。FPGA具有極強的實(shí)時(shí)性和并行處理能力，這使其對信號進(jìn)行實(shí)時(shí)處理成為可能。FPGA內部一般都包含邏輯單元(查找表/觸發(fā)器)、存儲單元(BRAM)、乘加單元(MAC)和一些其他的時(shí)鐘、引腳單元等[1-3]。

現代數字信號處理的主要發(fā)展趨勢是：算法結構日趨復雜，計算量大，實(shí)時(shí)性要求高，并且包含大量的三角函數、開(kāi)方、對數等復雜函數的計算。但FPGA內部的乘加單元并不適合直接進(jìn)行此類(lèi)函數的計算，需要把各種復雜函數分解為簡(jiǎn)單的移位、加法和乘法結構，進(jìn)而在FPGA中實(shí)現[4]。

當前，在FPGA上實(shí)現三角函數、開(kāi)方、對數等復雜函數的計算，技術(shù)領(lǐng)域最常見(jiàn)的是除法，其次為開(kāi)方和三角函數，很少涉及對數和其他復雜一些的函數。而在FPGA具體的實(shí)現上，此類(lèi)函數一般采用直接查表法或冪級數展開(kāi)法，對于三角函數和開(kāi)方的計算，也會(huì )采用CORDIC的計算方法，但這三種方法的應用都有一定的局限性[4]。

1 現有的FPGA實(shí)現方法

(1)在FPGA上采用直接查表方法，來(lái)實(shí)現函數的計算，具有：

優(yōu)點(diǎn)——通用性強、結構簡(jiǎn)單;

缺點(diǎn)——隨著(zhù)輸入位寬的增加，內部存儲量的消耗呈指數性增長(cháng)。

表1給出了不同輸入輸出位寬所需要的存儲單元(BRAM)。

表1 不同輸入輸出位寬所需要的存儲單元

可以看出，輸入輸出位寬較小時(shí)，直接查表法可以滿(mǎn)足實(shí)現要求，但在數字信號處理領(lǐng)域，輸入輸出一般都在16bits以上，這時(shí)采用直接查表法就很難滿(mǎn)足實(shí)現需求。

這里以開(kāi)方算法為例進(jìn)行說(shuō)明。采用直接查表法進(jìn)行開(kāi)方計算有2種方式。

方式一：在完全保證精度的條件下，采用直接查表法。若開(kāi)方為16bits輸入16bits輸出，在完全保證精度的條件下，FPGA就需要存儲216深度的數據，需要64塊18k BRAM的存儲空間。而一片中等FPGA一般包含幾十塊到幾百塊的18k BRAM存儲單元，此時(shí)計算就要用掉大部分的存儲單元，顯然不滿(mǎn)足實(shí)現的資源需求。

方式二：降低精度，減少輸入位寬，采用直接查表法。

表2 直接查表法開(kāi)方誤差表

可以看出，隨著(zhù)實(shí)際有效輸入的增加，計算精度變大，很難滿(mǎn)足計算的誤差要求。

(2)在FPGA上采用冪級數展開(kāi)法計算函數。

優(yōu)點(diǎn)——計算精度可控，多級展開(kāi)可以達到較高的計算精度;

缺點(diǎn)——冪級數展開(kāi)法為了達到較高的精度，需要多級展開(kāi)，這樣就需要采用較多的資源來(lái)實(shí)現。

以exp為例(0～π/4范圍內)，采用三角函數冪級數展開(kāi)法：

若輸入為16bits，采用冪級數展開(kāi)法的計算框圖如圖1。

從資源方面考慮，三角函數冪級數展開(kāi)法在FPGA中的實(shí)現需要5級乘法和3級加法，考慮每級乘法位寬需要擴展，實(shí)際需要FPGA的12個(gè)乘法器

(18bitsmes;18bits)資源。此外從誤差方面考慮，0～π/4范圍內，cosΦ的最大誤差為0.046%， sinΦ的最大誤差為0.35%。

圖 1 冪級數展開(kāi)法實(shí)現exp計算

此外冪級數展開(kāi)法的應用范圍也比較有限，開(kāi)方、倒數、對數、三角函數的計算可以采用冪級數展開(kāi)法，但對于等較復雜的函數計算就不再適合用此方法進(jìn)行計算。

(3)在FPGA上采用CORDIC法來(lái)實(shí)現函數的計算。

優(yōu)點(diǎn)：將復雜的運算分解為簡(jiǎn)單移位、加迭代

運算，結構規則，運算周期可以預測，比較適合于FPGA實(shí)現;

缺點(diǎn)：一般使用多周期方式，單周期方式資源消耗較高，并且計算僅限于向量旋轉、開(kāi)方等有限的范圍。

采用CORCIC計算三角函數，16bits輸入，在多周期條件下需要500個(gè)左右的LUT/FFs，在單周期條件下，需要1000個(gè)左右的LUT/FFs。

2 本文提出的方法

本文在FPGA上采用兩級方法進(jìn)行函數計算：第一級，直接利用輸入數據的高有效位確定計算結果的有效范圍;第二級，直接利用輸入數據的低有效位進(jìn)行計算結果的誤差調整。本研究方法充分利用FPGA內部的各種邏輯資源、乘加器(或乘法器)資源和BRAM資源：可以根據FPGA內部BRAM資源的大小采用相應深度的數據表存儲第一級數據的有效范圍;采用FPGA內部的乘加器(或乘法器)資源進(jìn)行乘加操作。此方法具有控制簡(jiǎn)單，結構規則，單運算周期，計算精度較高的特點(diǎn)，適合于FPGA的算法實(shí)現。

此外，采用本研究方法的兩級計算的方法，不同函數的計算實(shí)現方法一致，只要修改第一級計算高有效位數據表格中的數據，就可以復用設計，有利于資源共享和模塊化實(shí)現。

圖2 FPGA兩級法進(jìn)行函數的計算

同現有方案的比較分析：

(1)同直接查表法比較

以開(kāi)方為例進(jìn)行，資源和誤差的列表如表3?？梢钥闯?，在資源和誤差方面，本研究方法在FPGA上實(shí)現函數計算優(yōu)勢明顯。此外，FPGA可以通過(guò)增加存儲單元和擴展輸出位寬來(lái)進(jìn)一步提高計算精度。

表3 兩級計算法開(kāi)方同直接查表法誤差比較表

(2)同冪級數展開(kāi)法的比較

首先，本問(wèn)題出的新方法比冪級數展開(kāi)法的應用范圍更廣泛。其次，在同樣的函數下，以exp的計算為例，本文提出的新方法資源更好，誤差更小。在資源方面，FPGA上采用的兩級計算方法，同時(shí)計算只需要2個(gè)乘法器即可，遠遠少于冪級數展開(kāi)法的資源消耗;在誤差方面，0～π/4范圍內，16bits輸入，cosΦ和sinΦ的最大誤差都小于10-5，因此此方法誤差比冪級數展開(kāi)法誤差要小。

(3)同CORDIC方法比較

首先，本文提出的新方法比冪級數展開(kāi)法的應用范圍更廣泛。其次，在同樣的函數下，以exp的計算為例，新方法資源消耗相對較少，cosΦ和sinΦ同時(shí)計算只需要300個(gè)左右的LUT/FFs即可。而且，新方法采用的是單運算周期模式，運算速度更高。

3 實(shí)現流程

如圖3所示，本論文采取的實(shí)現方法如下：

步驟一：根據一維函數的計算，預先生成一定深度的計算表格;

步驟二：移位(可選)，把數據的高有效位移位成1，增加較小數據的計算精度;

步驟三：提取數據的高bits，作為第一級數據表的地址，得到數據值y(n);

步驟四：提取數據的高bits，加1后作為第一級數據表的地址，得到下一個(gè)數據值y(n+1);

步驟五：計算差值diff(n)=y(n+1)-y(n);

步驟六：提取數據的低bits，作為有效的偏移數據，同計算的差值相乘，得到偏移off(n)=data_lsb(n)*diff(n);

步驟七：高位查表數據值y(n)同偏移相加得到計算值out=y(n)+off(n);

步驟八：根據步驟一的移位逆操作(可選)，得到實(shí)際輸出值。

圖3 FPGA兩級法求解函數的流程框圖

如圖4所示，對本研究方法進(jìn)行進(jìn)一步的詳細說(shuō)明。

對于任意一個(gè)一維函數，若采樣點(diǎn)足夠密集，那么任何2個(gè)采樣點(diǎn)之間可以看作是線(xiàn)性關(guān)系，可以通過(guò)插值的方法來(lái)計算。

圖4 FPGA兩級法求解函數的詳細說(shuō)明

由圖6可得出，兩極法的誤差范圍更小。

4 結論

在現代數字信號處理方面，FPGA具有極強的實(shí)時(shí)性和并行處理能力[5]。在FPGA的實(shí)現上，本文介紹了現有的直接查表法、冪級數展開(kāi)法、CORDIC計算方法的優(yōu)缺點(diǎn)。在此基礎上，本文研究了基于FPGA的兩極計算法，并把它和以上三種方法進(jìn)行比較，得出兩極算法具有控制簡(jiǎn)單、結構規則、單運算周期、計算精度較高的特點(diǎn)。此外，本文詳細介紹了兩極算法的實(shí)現流程，并舉例來(lái)進(jìn)行說(shuō)明，使讀者能夠更好地掌握兩極算法。

參考文獻

Xilinx-Virtex7 Data Sheets. 2014.11.

Xilinx-Virtex7 User Guides. 2014.11.

Altera-StraTIx V Device Datasheet. 2015.7.

貝耶爾.數字信號處理的FPGA實(shí)現(第3版)[M].2011.

John G.Proakis，Dimitris G.Manolakis.數字信號處理DD原理、算法與應用(第四版)[M].

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 數字信號 FPGA

評論

相關(guān)推薦

FPGA如何同DDR3存儲器進(jìn)行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

用C/C++語(yǔ)言開(kāi)發(fā)大規模FPGA [轉載于www.fpga.com.cn]

xiaohua | 2002-09-24

Altera的FPGA下載常見(jiàn)問(wèn)題經(jīng)驗小結

資源下載 Altera FPGA 常見(jiàn)問(wèn)題經(jīng)驗 | 2007-12-13

iCE40 LP/HX系列FPGA：萊迪思的創(chuàng )新可編程解決方案

嵌入式系統 iCE40 LP/HX FPGA 萊迪思可編程解決方案 | 2024-06-07

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實(shí)現創(chuàng )新

視頻 Altera FPGA ASIC | 2009-07-13

國產(chǎn)28納米FPGA流片

嵌入式系統 FPGA EDA 芯片 | 2024-05-31

利用強大的軟件設計工具為FPGA開(kāi)發(fā)者賦能

嵌入式系統軟件設計工具 FPGA 萊迪思 | 2024-07-17

FPGA是實(shí)現敏捷、安全的工業(yè)4.0發(fā)展的關(guān)鍵

嵌入式系統 FPGA 工業(yè)4.0 Lattice 萊迪思 | 2024-05-06

實(shí)時(shí)的噪聲源定位系統

視頻 NI LabVIEW FPGA | 2009-03-25

視頻協(xié)議板-FPGA配置基于LatticeECP3的設計

設計方案視頻協(xié)議 -FPGA 配置基于 LatticeECP3 | 2014-05-20

LabVIEW 8.20技術(shù)資料大全簡(jiǎn)介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

萊迪思推出全新安全控制FPGA系列產(chǎn)品，具備先進(jìn)的加密敏捷性和硬件可信根

嵌入式系統萊迪思安全控制 FPGA 加密敏捷性硬件可信根 | 2024-06-27

基于FPGA的數字信號處理--什么是定點(diǎn)數？

嵌入式系統 FPGA 數字信號定點(diǎn)數 | 2024-05-11

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

高速ADC與內置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

LatticeECP3設計的視頻協(xié)議板電路圖-FPGA配置

設計方案 LatticeECP3 設計視頻協(xié)議電路圖 -FPGA | 2011-06-27

s3c2410+fpga 做視頻無(wú)線(xiàn)傳輸

herbertwj | 2004-08-15

基于FPGA的鎖相環(huán)位同步提取電路

設計方案電子電路圖，FPGA 鎖相環(huán) | 2012-07-27

采用創(chuàng )新的FPGA 器件來(lái)實(shí)現更經(jīng)濟且更高能效的大模型推理解決方案

嵌入式系統 Achronix FPGA | 2024-06-18

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

9種單片機常用的軟件架構

嵌入式系統 PCB FPGA 架構 | 2024-05-21

3-DES算法的FPGA高速實(shí)現(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

LabVIEW FPGA 模塊簡(jiǎn)介

視頻 NI LabVIEW FPGA | 2009-04-01

ALTERA的PCI_IP Core問(wèn)答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

Altera公司cyclone系列FPGA-1C6電路圖

設計方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

基于SD7502構成的FPGA-ASK電路圖

設計方案基于 SD7502 構成 FPGA-ASK 電路圖 | 2011-07-13

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統萊迪思 FPGA 小型FPGA | 2024-07-23

基于FPGA的可編程數字濾波器系統

資源下載 Max FPGA 可編程數字濾波器 | 2007-12-14

FPGA比單片機厲害嗎？

嵌入式系統 FPGA 單片機 | 2024-06-13

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>