<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 利用FPGA進(jìn)行基本運算及特殊函數定點(diǎn)運算

利用FPGA進(jìn)行基本運算及特殊函數定點(diǎn)運算

作者：時(shí)間：2024-02-19 來(lái)源：至芯科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

一、前言

本文引用地址：http://dyxdggzs.com/article/202402/455484.htm

　　FPGA以擅長(cháng)高速并行數據處理而聞名，從有線(xiàn)/無(wú)線(xiàn)通信到圖像處理中各種DSP算法，再到現今火爆的AI應用，都離不開(kāi)卷積、濾波、變換等基本的數學(xué)運算。但由于FPGA的硬件結構和開(kāi)發(fā)特性使得其對很多算法不友好，之前本人零散地總結和轉載了些基本的數學(xué)運算在FPGA中的實(shí)現方式，今天做一個(gè)系統的總結歸納。

二、FPGA中的加減乘除

1.硬件資源

　　Xilinx 7系列的FPGA中有DSP Slice ，叫做“DSP48E1”這一專(zhuān)用硬件資源，這是一個(gè)功能強大的計算單元，單就用于基本運算的部分有加減單元和乘法器。詳見(jiàn)參考文獻1.

因此可以直接用HDL語(yǔ)言中的加、減、乘符號實(shí)現變量與常量間運算操作以及變量與變量間操作。而四則運算中的除法沒(méi)有基本的邏輯計算單元可以對應，因此計算除法需要調用除法器IP核。

2.確認數據的表示范圍

　　有符號數：（補碼）-2^(N-1) ~ 2^(N-1)-1 如N = 8，則表示范圍是：-128 ~ 127.

　無(wú)符號數：0~2^N-1 如N = 8，則表示范圍是：0~255.

　　定點(diǎn)數：2Q13 范圍是：-4~4-2^(-13) 精度是：2^(-13)

3.結果有效位寬

　　首先討論結果位寬問(wèn)題。在FPGA中往往采用定點(diǎn)運算替代浮點(diǎn)運算來(lái)降低硬件資源占用率和計算延遲，其中的精髓就是精度與資源的權衡。若按照保留計算結果的全部精度，N bit數與Mbit數相加結果需要N+1bit（N>M）。N bit數與M bit數相乘之積需要N+M bit。而減法可以轉化為加法，除法則轉換為乘法和加減法的組合。如果操作數是定點(diǎn)小數，則在滿(mǎn)足以上準則的前提下，A與B相加（A小數點(diǎn)位數>B小數點(diǎn)位數），結果小數點(diǎn)位數與A相同；A與B相乘（小數點(diǎn)位數分別為p和q），結果小數點(diǎn)位數是p+q。

4.定點(diǎn)運算步驟

　　然而（話(huà)鋒一轉），在大多數場(chǎng)合下，不需要以上這么多位來(lái)保留計算結果，因為我們在進(jìn)行數學(xué)運算時(shí)，已經(jīng)知道輸入數據的大致范圍，一個(gè)數除以1000和除以1結果數據所需最小位寬能一樣么？加減運算的操作步驟是先對齊小數點(diǎn)位數，后加減。而乘法是先計算后取小數點(diǎn)。這實(shí)際上與十進(jìn)制運算一致，我們看看具體的計算步驟：

整數之間加減以及乘法的統一步驟：預估結果位寬N --> 按照結果位寬擴展操作數符號位以防止溢出 --> 運算取低N位。

定點(diǎn)小數加減運算步驟：預估結果位寬N --> 得到結果小數點(diǎn)后位數 --> 對齊操作數整數位和小數位，確定擴展位寬M（M≥N） --> 加減運算取低M位。

定點(diǎn)小數乘法運算步驟：預估結果位寬N --> 得到結果小數點(diǎn)后位數 --> 擴展操作數位寬 --> 相乘取低N位

5. 變量與常量運算化簡(jiǎn)

　　以上討論的均是兩變量之間的運算規則，當然結果位寬及格式準則是適用的。變量與常量的運算的優(yōu)勢在于，可以將乘除法轉換成加減以及移位運算實(shí)現，從而降低計算復雜度和延遲。當常數項C為2的整數次冪（C = 2^p），則乘C等于變量左移p位，除以C等于變量右移p位。幾個(gè)在書(shū)中看到的幾個(gè)簡(jiǎn)單示例：A*16 = A <<4　　A*20 = A<<4 + A<<2.　　A除以2 = A >>1　　A除以3 = A*(0.25+0.0625+0.0156) = A>>2+A>>4+A>>6　　A除以5 = A*(0.125+0.0625+0.0156) = A>>3 + A>>4 + A>>6.其中乘法完全等價(jià)對應的移位相加操作，而除法的移位代替會(huì )損失精度。

三、如何計算特殊函數

　　FPGA內部的DSP Slice可以直接進(jìn)行最基本的加法和乘法運算，但是對于其他比如對數、指數、三角函數、開(kāi)根號等特殊函數就無(wú)能為力了。這時(shí)需要借助算法對這些特殊函數進(jìn)行變換和簡(jiǎn)化。FPGA實(shí)現復雜函數的常用手段一個(gè)是級數展開(kāi)，再一個(gè)就是CORDIC算法。關(guān)于CORDIC的理論知識和具體內容詳見(jiàn)參考文獻2，這里主要闡述CORDIC的IP核調用以及應用示例。CORDIC算法就是通過(guò)一定的手段，將很多復雜的特殊函數變?yōu)橄嗉右莆贿\算，這一點(diǎn)對于硬件芯片實(shí)現來(lái)說(shuō)非常友好。CORDIC分為旋轉模式和矢量模式，配合圓周坐標、線(xiàn)性坐標和雙曲線(xiàn)坐標會(huì )有六種組合，具體見(jiàn)下表：

從表中發(fā)現，基本的乘

除法、三角函數、反三角函數、雙曲函數、反雙曲函數、開(kāi)根號都能夠直接求得，那其他函數怎么辦？

　常見(jiàn)的函數計算需求基本都能滿(mǎn)足，雖上述變換式對自變量定義域有限制，但同樣可以分析輸入數據的取值范圍并利用簡(jiǎn)單的數學(xué)變換得到想要的結果。Xilinx同時(shí)提供了浮點(diǎn)IP核以及CORDIC IP核，前者調用簡(jiǎn)單但占用資源大，延遲高，因此利用CORDIC算法計算函數是個(gè)較好的選擇。

四、CORDIC計算e^x Demo

1. 算法仿真分析

　　要計算e^x數值需要讓CORDIC工作在雙曲坐標的旋轉模式下，通過(guò)e^x = sinhx+coshx關(guān)系式間接求得。首先看下sinh和cosh函數的曲線(xiàn)，有個(gè)直觀(guān)認識。

我們用MATLAB毫不費力地驗證一下公式正確性：

在設計后也同樣要借助MATLAB進(jìn)行仿真驗證。

2. CORDIC IP核

　　現在通過(guò)查看user guide得知CORDIC IP核的接口及主要特性。

　接口包括輸入笛卡爾數據輸入通道、相位輸入通道、全局信號以及數據輸出通道。該IP核有兩種結構：串行和并行，可根據數據吞吐量需求選擇，并行結構可以每個(gè)時(shí)鐘輸出一個(gè)計算結果。如果計算sinh和cosh，要向phase通道輸入相位信息，X_OUT是cosh(phase),Y_OUT是sinh(phase).輸入phase必須滿(mǎn)足數據范圍，否則出現不可預計結果。輸出幀結構及數據范圍如下：

　其中輸入數據格式為2QN，輸出則是1QN。由于均是有符號數，也就是輸入整數部分3bit，輸出整數部分2bit。接下來(lái)對IP核進(jìn)行配置，重點(diǎn)是第一頁(yè)，此處將其配置為計算sinh和cosh模式，采用并行優(yōu)化的流水線(xiàn)結構。相位以角度為單位，輸入輸出位寬設置成16bit。

3.HDL代碼設計及仿真驗證

設計代碼：
`timescale 1ns / 1ps

module cordic_ex#(parameter DIN_W = 16,
DOUT_W = 16)
(
input clk,
input [DIN_W-1:0] din,//2Q13
input din_vld,

output reg [DOUT_W+1-1:0] dout = 0,//2Q14
output reg dout_vld = 0
);

wire [DOUT_W*2-1 : 0] m_axis_dout_tdata;
wire m_axis_dout_tvalid;
wire signed [DOUT_W-1:0] sinh,cosh;

// ex = sinhx + coshx <1Q14+1Q14 = 2Q14>
always @(posedge clk)begin
dout <= sinh + cosh;
end

assign sinh = m_axis_dout_tdata[DOUT_W*2-1 -:DOUT_W];
assign cosh = m_axis_dout_tdata[DOUT_W-1 -:DOUT_W];

always @(posedge clk)begin
if(m_axis_dout_tvalid)begin
dout_vld <= 1'b1;
end
else
dout_vld <= 0;
end

cordic_0 cordic_cosh_sinh (
.aclk(clk), // input wire aclk
.s_axis_phase_tvalid(din_vld), // input wire s_axis_phase_tvalid
.s_axis_phase_tdata(din), // input wire [15 : 0] s_axis_phase_tdata
.m_axis_dout_tvalid(m_axis_dout_tvalid), // output wire m_axis_dout_tvalid
.m_axis_dout_tdata(m_axis_dout_tdata) // output wire [31 : 0] m_axis_dout_tdata
);

endmodule

cordic_ex

用MATLAB產(chǎn)生兩組數據，并將角度值定點(diǎn)化后作為設計模塊數據激勵：

testbench：
`timescale 1ns / 1ps

module cordic_ex_tb();

parameter CYC = 20;

reg clk;
reg [16-1:0] din;
reg din_vld;

wire signed [17-1:0] dout;
wire dout_vld;

cordic_ex#(.DIN_W(16),
.DOUT_W(16))
uut(
.clk (clk) ,
.din (din) ,//2Q13
.din_vld (din_vld) ,
.dout (dout) ,//2Q14
.dout_vld (dout_vld)
);

initial begin
clk = 1;
forever #(CYC/2) clk = ~clk;
end

initial begin
#1;
din = 0;
din_vld = 0;
#(CYC*10);

din_vld = 1;
din = 16'b0001010000011011;//pi * 1/5
#(CYC*1);
din = 16'b1110011011011110;//-pi * 1/4
#5;
$stop;
end

endmodule

cordic_ex_tb

仿真結果：

仿真波形表明，計算結果與MATLAB浮點(diǎn)運算相近，滿(mǎn)足一般計算需求。若想提高精度，可以增加CORDIC輸出數據位寬。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： FPGA 數學(xué)運算

評論

相關(guān)推薦

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

LatticeECP3設計的視頻協(xié)議板電路圖-FPGA配置

設計方案 LatticeECP3 設計視頻協(xié)議電路圖 -FPGA | 2011-06-27

實(shí)時(shí)的噪聲源定位系統

視頻 NI LabVIEW FPGA | 2009-03-25

LabVIEW FPGA 模塊簡(jiǎn)介

視頻 NI LabVIEW FPGA | 2009-04-01

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實(shí)現創(chuàng )新

視頻 Altera FPGA ASIC | 2009-07-13

采用創(chuàng )新的FPGA 器件來(lái)實(shí)現更經(jīng)濟且更高能效的大模型推理解決方案

嵌入式系統 Achronix FPGA | 2024-06-18

3-DES算法的FPGA高速實(shí)現(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

基于FPGA的鎖相環(huán)位同步提取電路

設計方案電子電路圖，FPGA 鎖相環(huán) | 2012-07-27

高速ADC與內置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統萊迪思 FPGA 小型FPGA | 2024-07-23

LabVIEW 8.20技術(shù)資料大全簡(jiǎn)介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

基于FPGA的可編程數字濾波器系統

資源下載 Max FPGA 可編程數字濾波器 | 2007-12-14

國產(chǎn)FPGA，走到哪一步了？

嵌入式系統 FPGA | 2024-07-30

FPGA比單片機厲害嗎？

嵌入式系統 FPGA 單片機 | 2024-06-13

基于SD7502構成的FPGA-ASK電路圖

設計方案基于 SD7502 構成 FPGA-ASK 電路圖 | 2011-07-13

將ASIC IP核移植到FPGA上——明了需求和詳細規劃以完成充滿(mǎn)挑戰的任務(wù)

嵌入式系統 FPGA SmartDV | 2024-07-29

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

Altera公司cyclone系列FPGA-1C6電路圖

設計方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

國產(chǎn)28納米FPGA流片

嵌入式系統 FPGA EDA 芯片 | 2024-05-31

Altera的FPGA下載常見(jiàn)問(wèn)題經(jīng)驗小結

資源下載 Altera FPGA 常見(jiàn)問(wèn)題經(jīng)驗 | 2007-12-13

利用強大的軟件設計工具為FPGA開(kāi)發(fā)者賦能

嵌入式系統軟件設計工具 FPGA 萊迪思 | 2024-07-17

視頻協(xié)議板-FPGA配置基于LatticeECP3的設計

設計方案視頻協(xié)議 -FPGA 配置基于 LatticeECP3 | 2014-05-20

FPGA如何同DDR3存儲器進(jìn)行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

9種單片機常用的軟件架構

嵌入式系統 PCB FPGA 架構 | 2024-05-21

iCE40 LP/HX系列FPGA：萊迪思的創(chuàng )新可編程解決方案

嵌入式系統 iCE40 LP/HX FPGA 萊迪思可編程解決方案 | 2024-06-07

s3c2410+fpga 做視頻無(wú)線(xiàn)傳輸

herbertwj | 2004-08-15

用C/C++語(yǔ)言開(kāi)發(fā)大規模FPGA [轉載于www.fpga.com.cn]

xiaohua | 2002-09-24

ALTERA的PCI_IP Core問(wèn)答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

萊迪思推出全新安全控制FPGA系列產(chǎn)品，具備先進(jìn)的加密敏捷性和硬件可信根

嵌入式系統萊迪思安全控制 FPGA 加密敏捷性硬件可信根 | 2024-06-27

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>