<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > CPU主頻比FPGA快，但為啥FPGA才可以加速？

CPU主頻比FPGA快，但為啥FPGA才可以加速？

作者：時(shí)間：2018-03-27 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

　　CPU的主頻高達幾個(gè)GHz，FPGA的速率往往在幾百兆。但是，往往我們會(huì )說(shuō)FPGA會(huì )給CPU進(jìn)行加速。

本文引用地址：http://dyxdggzs.com/article/201803/377455.htm

　　雖然CPU主頻很高，但其是通用處理器，做某個(gè)特定運算(如信號處理，圖像處理)可能需要很多個(gè)時(shí)鐘周期;而FPGA可以通過(guò)編程重組電路，直接生成專(zhuān)用電路，加上電路并行性，可能做這個(gè)特定運算只需要一個(gè)時(shí)鐘周期。

　　假設我們用FPGA完整的實(shí)現了CPU，然后再跑軟件的話(huà)，的確比CPU慢。問(wèn)題是FPGA不會(huì )那么干，它會(huì )直指問(wèn)題本質(zhì)，解決問(wèn)題。

　　

　　即使我們用FPGA實(shí)現一個(gè)CPU，也是為了做一些芯片驗證或者說(shuō)需要一些需要CPU和FPGA需要緊密結合的場(chǎng)景，這種場(chǎng)景現在也逐步由SoC的FPGA實(shí)現了。

　　

　　舉個(gè)具體的例子，比如有兩個(gè)數組，其中有256個(gè)32位數，我們現在要把它們對應相加變成一個(gè)數組，用CPU寫(xiě)最快大概是這樣子的：

　　r[0] = a[0] + b[0];

　　r[1] = a[1] + b[1];

　　...

　　r[255] = a[255] + b[255];

　　當然也可能會(huì )這么寫(xiě)(在分支預測準確，指令緩存不大的情況下可能更快)：

　　for (int i = 0; i < 255; i++)

　　r[i] = a[i] + b[i];

　　CPU指令流水線(xiàn)

　　根據之前描述的基礎，指令進(jìn)入流水線(xiàn)，通過(guò)流水線(xiàn)處理，從流水線(xiàn)出來(lái)的過(guò)程，對于我們程序員來(lái)說(shuō)，是比較直觀(guān)的。

　　I486擁有五級流水線(xiàn)。分別是：取指(Fetch)，譯碼(D1, main decode)，轉址(D2, translate)，執行(EX, execute)，寫(xiě)回(WB)。某個(gè)指令可以在流水線(xiàn)的任何一級。

　　

　　流水線(xiàn)的數量不可能無(wú)限制增加，流水線(xiàn)的加速也有很多風(fēng)險。即使流水線(xiàn)可以無(wú)限制增加，不管CPU的流水線(xiàn)又多少條，每個(gè)指令執行都必須順序執行。對速率的提升也是有限的。

　　對于上圖中的流水線(xiàn)有一個(gè)明顯的缺陷。對于下面的指令代碼，它們的功能是將兩個(gè)變量的內容進(jìn)行交換。

　　

　　第二條xor指令需要第一條xor指令計算的結果a，但是直到第一條指令執行完成才會(huì )寫(xiě)回。所以流水線(xiàn)的其他指令就會(huì )在當前流水級等待直到第一條指令的執行和寫(xiě)回階段完成。第二條指令會(huì )等待第一條指令完成才能進(jìn)入流水線(xiàn)下一級，同樣第三條指令也要等待第二條指令完成。

　　這個(gè)現象被稱(chēng)為流水線(xiàn)阻塞或者流水線(xiàn)氣泡。

　　對FPGA來(lái)說(shuō)，也可以用上面相同的寫(xiě)法，不同在于：

　　CPU是一個(gè)一個(gè)加法計算，而FPGA排好邏輯電路，在一個(gè)時(shí)鐘周期內計算完畢。就算CPU主頻比FPGA快100倍也趕不上啊。

　　計算機最基本的功能就是運算了，其中最基本的又要屬加法運算。我們知道計算機使用二進(jìn)制來(lái)保存和處理數據，因此這里的加減法運算都是用二進(jìn)制進(jìn)行。下面雅樂(lè )網(wǎng)總結了一些運算器中加法器的設計。

　　二進(jìn)制加法

　　

　　一位的二進(jìn)制加法非常簡(jiǎn)單，因為只有四種情況

　　0+0=0 進(jìn)位0

　　0+1=1 進(jìn)位0

　　1+0=1 進(jìn)位0

　　1+1=0 進(jìn)位1

　　多位的二進(jìn)制加法和十進(jìn)制類(lèi)似，每一位上兩個(gè)數相加后再加上進(jìn)位就可以了

　　FPGA半加器

　　半加器可以實(shí)現兩個(gè)1位的二進(jìn)制數字相加，并且輸出結果和進(jìn)位。

　　真值表：

　　

　　一位半加器真值表

　　由表中可以看見(jiàn)，這種加法沒(méi)有考慮低位來(lái)的進(jìn)位，所以稱(chēng)為半加。

　　輸出和：A和B一個(gè)為0 一個(gè)為1的時(shí)候輸出1 兩個(gè)0或兩個(gè)1輸出0 因此可以用異或門(mén)連接。

　　進(jìn)位：只有AB均為1的時(shí)候進(jìn)位輸出1 進(jìn)位Cout = AB 用與門(mén)連接。

　　

　　一位半加器

　　FPGA全加器

　　全加器在半加器的基礎上增加了進(jìn)位它輸入三個(gè)數字兩個(gè)加數和一個(gè)進(jìn)位 Cin，輸出結果和進(jìn)位

　　

　　一位全加器真值表

　　從真值表很容易寫(xiě)出如下邏輯表達式

　　S=P異或Cout 其中P=A異或B

　　Cout=P·Cin+G 其中G=A·B

　　

　　一位全加器

　　四位行波加法器

　　將四個(gè)全加器每一個(gè)的僅為輸出連接到下一個(gè)的進(jìn)位輸入就可以構成一個(gè)4位串行加法器了

　　

　　四位行波加法器

　　這樣構成的加法器連接起來(lái)很簡(jiǎn)單，但是也有不足：每一個(gè)全加器計算的時(shí)候必須等待它的進(jìn)位輸入產(chǎn)生后才能計算，所以四個(gè)全加器并不是同時(shí)進(jìn)行計算的，而是一個(gè)一個(gè)的串行計算。這樣會(huì )造成較大的延遲。

　　超前進(jìn)位加法器(Carry-Lookahead Adder，CLA)

　　超前進(jìn)位加法器的思路是提前算出每一位上的進(jìn)位。

　　分析每一個(gè)全加器的局部

　　一個(gè)全加器 A B Cn 如果有兩個(gè)或兩個(gè)以上的1 那么進(jìn)位Cn+1就是1

　　因此 Cn+1 = AB + ACn + BCn = AB + Cn(A+B)

　　記生成(Generate)信號：Gi=Ai·Bi

　　傳播(Propagate)信號：Pi=Ai+Bi

　　那么Ci+1=Gi+Pi·Ci

　　根據這個(gè)遞推關(guān)系，可以推導出每一位的進(jìn)位

　　每一位的進(jìn)位跟前一級進(jìn)位有關(guān)，前一級又跟前一級的前一級有關(guān) 一直向前最終是和C0相關(guān)。而最開(kāi)始的第一位C0和A0 B0都是已知的

　　

　　這樣算出結果只需要經(jīng)過(guò)三個(gè)門(mén)延遲就可以了。

　　隨著(zhù)位數的增加，進(jìn)位的計算公式會(huì )越來(lái)越復雜。32位的進(jìn)位計算需要32與門(mén)

　　所以我們需要更多的計算位寬或者更大的數組，或者矩陣的運算的時(shí)候，我們使用FPGA的優(yōu)勢就體現出來(lái)。再多的計算，也就是放置更多的邏輯資源。

　　FPGA的并行是真并行，CPU完全沒(méi)得比。CPU如果想并行最多也就是讓多個(gè)核并行，但是對于大部分算法實(shí)現來(lái)說(shuō)，如上例，多個(gè)核之間的同步調度開(kāi)銷(xiāo)遠遠大于計算開(kāi)銷(xiāo)，就算多個(gè)核之間的調用開(kāi)銷(xiāo)可以做的很小，一般CPU也就那幾個(gè)核，而FPGA只要門(mén)足夠，想并行幾路就可以并行幾路。

　　所以在做可并行的計算密集型任務(wù)時(shí)，比如信號處理，網(wǎng)絡(luò )傳輸等等FPGA可以幫上忙;但是如果做我們常見(jiàn)的串行為主的任務(wù)而言，FPGA的確遠遠比不上CPU。

　　FPGA是配角

　　使用FPGA不一定總能加速，只是在某些強計算和數據處理的方面，因為其硬件電路并行運行和有很多DSP硬核資源供調用的特點(diǎn)，可以工作得更出色。FPGA本身也只是輔助角色，起控制的還是CPU本身，所以FPGA并不能代替CPU，只是在完成一件大任務(wù)的過(guò)程中將某部分任務(wù)分解給FPGA可以更好地一起完成任務(wù)。在這過(guò)程中也會(huì )有額外的開(kāi)銷(xiāo)產(chǎn)生，在某些場(chǎng)合，可能用了FPGA而效果更差也是有的。

　　另外，通常說(shuō)的使用FPGA加速比CPU和GPU省電，是指在完成同樣的任務(wù)下，FPGA耗費的電力比起CPU和GPU更少一些，相對而言的，并不是說(shuō)FPGA本身就一定省電。

　　FPGA的弱點(diǎn)

　　1.開(kāi)發(fā)周期長(cháng)。需要對特定的應用編寫(xiě)特定的FPGA。只要干的事情稍有不同，一般來(lái)說(shuō)FPGA代碼就要重新寫(xiě)一遍或者是至少要修改很多東西。開(kāi)發(fā)代價(jià)和碼農碼幾行代碼完全不可比。而且一般需要若干工程師花費若干周才能搞的定。重點(diǎn)是會(huì )寫(xiě)的人還不多。

　　2.并不是所有東西都適合FPGA。FPGA適合于做那些可并行計算的東西，例如矩陣運算。如果是一些判斷類(lèi)的問(wèn)題，FPGA算得并沒(méi)有CPU快(這個(gè)時(shí)候時(shí)鐘周期才是關(guān)鍵因素)。所以現實(shí)中都是有人來(lái)分析，在整個(gè)任務(wù)中有哪些地方可以并行計算，把這些地方替換為FPGA卡。

　　由于現在機器學(xué)習、大數據比較火，里面矩陣運算成千上萬(wàn)，所以沒(méi)有出現定制的ASIC之前，FPGA加速還是業(yè)界主流?，F在百度、微軟、谷歌等公司都已經(jīng)把FPGA加速運用到了實(shí)際的商業(yè)運營(yíng)中。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： FPGA CPU

評論

相關(guān)推薦

視頻協(xié)議板-FPGA配置基于LatticeECP3的設計

設計方案視頻協(xié)議 -FPGA 配置基于 LatticeECP3 | 2014-05-20

ALTERA的PCI_IP Core問(wèn)答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

被英特爾拖累：有游戲開(kāi)發(fā)商將服務(wù)器的CPU換成了AMD

消費電子英特爾 AMD CPU | 2024-07-16

利用強大的軟件設計工具為FPGA開(kāi)發(fā)者賦能

嵌入式系統軟件設計工具 FPGA 萊迪思 | 2024-07-17

龍芯 3C6000 服務(wù)器 CPU 流片成功：性能達英特爾至強 Silver 4314 水平

網(wǎng)絡(luò )與存儲龍芯中科 CPU | 2024-07-25

FPGA如何同DDR3存儲器進(jìn)行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

基于FPGA的可編程數字濾波器系統

資源下載 Max FPGA 可編程數字濾波器 | 2007-12-14

LatticeECP3設計的視頻協(xié)議板電路圖-FPGA配置

設計方案 LatticeECP3 設計視頻協(xié)議電路圖 -FPGA | 2011-06-27

中國科學(xué)院院士：CPU、GPU架構上國人沒(méi)貢獻很遺憾應加強創(chuàng )新

嵌入式系統 CPU GPU 架構 | 2024-07-12

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

實(shí)時(shí)的噪聲源定位系統

視頻 NI LabVIEW FPGA | 2009-03-25

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

RISC-V CPU進(jìn)入mini-ITX主板

嵌入式系統 Jupiter SpacemiT K1/M1 AI RISC-V CPU mini-ITX 主板 | 2024-07-02

Altera公司cyclone系列FPGA-1C6電路圖

設計方案 Altera 公司 cyclone 系列 FPGA-1C6 | 2009-07-17

用C/C++語(yǔ)言開(kāi)發(fā)大規模FPGA [轉載于www.fpga.com.cn]

xiaohua | 2002-09-24

s3c2410+fpga 做視頻無(wú)線(xiàn)傳輸

herbertwj | 2004-08-15

基于FPGA的鎖相環(huán)位同步提取電路

設計方案電子電路圖，FPGA 鎖相環(huán) | 2012-07-27

help, 44b0+fpga拖死cpu

sandman555 | 2005-02-05

英特爾 Panther Lake 移動(dòng)處理器規格曝光：最高“4+8+4”16 核 CPU、12 Xe3 核顯

消費電子英特爾 CPU | 2024-07-16

LabVIEW FPGA 模塊簡(jiǎn)介

視頻 NI LabVIEW FPGA | 2009-04-01

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統萊迪思 FPGA 小型FPGA | 2024-07-23

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實(shí)現創(chuàng )新

視頻 Altera FPGA ASIC | 2009-07-13

基于SD7502構成的FPGA-ASK電路圖

設計方案基于 SD7502 構成 FPGA-ASK 電路圖 | 2011-07-13

100％自主龍芯架構！北航成功流片兩款CPU

EDA/PCB 龍芯架構北航 CPU | 2024-07-15

高速ADC與內置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

Altera的FPGA下載常見(jiàn)問(wèn)題經(jīng)驗小結

資源下載 Altera FPGA 常見(jiàn)問(wèn)題經(jīng)驗 | 2007-12-13

3-DES算法的FPGA高速實(shí)現(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

LabVIEW 8.20技術(shù)資料大全簡(jiǎn)介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

龍芯 3A6000 主板首次殺入美國市場(chǎng)：372.91 美元起，可選 12 種配置版本

國際視野龍芯 CPU 主板 PC | 2024-07-01

英特爾CPU故障率100％游戲商大崩潰改用AMD

消費電子英特爾 CPU 故障率游戲商 AMD | 2024-07-24

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>