<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 雷達信號處理：FPGA還是GPU?

雷達信號處理：FPGA還是GPU?

作者：MichaelParker 時(shí)間：2014-02-13 來(lái)源：摘自《電子發(fā)燒友》

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

　　FPGA和CPU一直是雷達信號處理不可分割的組成部分。傳統上FPGA用于前端處理，CPU用于后端處理。隨著(zhù)雷達系統的處理能力越來(lái)越強，越來(lái)越復雜，對信息處理的需求也急劇增長(cháng)。為此，FPGA不斷在提高處理能力和吞吐量，CPU也在發(fā)展以滿(mǎn)足下一代雷達的信號處理性能需求。這種努力發(fā)展的趨勢導致越來(lái)越多的使用CPU加速器，如圖形處理單元(GPU)等，以支持較重的處理負載。

本文引用地址：http://dyxdggzs.com/article/221498.htm

　　本文對比了FPGA和GPU浮點(diǎn)性能和設計流程。最近幾年，GPU已經(jīng)不僅能完成圖形處理功能，而且成為強大的浮點(diǎn)處理平臺，被稱(chēng)之為GP-GPU，具有很高的峰值FLOP指標。FPGA傳統上用于定點(diǎn)數字信號處理器(DSP)，而現在足以競爭完成浮點(diǎn)處理功能，也成為后端雷達處理加速功能的有力競爭者。

　　在FPGA前端，40 nm和28 nm均報道了很多可驗證的浮點(diǎn)基準測試結果。Altera的下一代高性能FPGA將采用Intel的14 nm三柵極技術(shù)，性能至少達到5 TFLOP。使用這種先進(jìn)的半導體工藝，性能可實(shí)現100 GFLOPs/W。而且，Altera FPGA現在支持OpenCL，這是GPU使用的一款優(yōu)秀的編程語(yǔ)言。

　　峰值GFLOPS指標

　　目前的FPGA性能可達到1TFLOP以上峰值，AMD和Nvidia最新的GPU甚至更高，接近4 TFLOP。但在某些應用中，峰值GFLOP，即TFLOP，提供的器件性能信息有限。它只表示了每秒能完成的理論浮點(diǎn)加法或乘法總數。這一分析表示，在雷達應用中，很多情況下，FPGA在算法和數據規模上超過(guò)了GPU吞吐量。

　　一種中等復雜且常用的算法是快速傅里葉變換(FFT)。大部分雷達系統由于在頻域完成大量處理工作，因此會(huì )經(jīng)常用到FFT算法。例如，使用單精度浮點(diǎn)處理實(shí)現一個(gè)4，096點(diǎn)FFT。它能在每個(gè)時(shí)鐘周期輸入輸出四個(gè)復數采樣。每個(gè)FFT內核運行速度超過(guò)80 GFLOP，大容量28 nm FPGA的資源支持實(shí)現7個(gè)此類(lèi)內核。

　　但如圖1所示，該FPGA的FFT算法接近400 GFLOP。這一結果基于“按鍵式”OpenCL編譯，無(wú)需FPGA專(zhuān)業(yè)知識。使用邏輯鎖定和設計空間管理器(DSE)進(jìn)行優(yōu)化，7內核設計接近單內核設計的fMAX，使用28 nm FPGA，將其提升至500 GFLOP，超過(guò)了10 GFLOPs/W。

圖1.Stratix V 5SGSD8 FPGA浮點(diǎn)FFT性能

圖1.Stratix V 5SGSD8 FPGA浮點(diǎn)FFT性能

　　這一GFLOPs/W結果要比CPU或者GPU功效高很多。對比GPU，GPU在這些FFT長(cháng)度上效率并不高，因此沒(méi)有進(jìn)行基準測試。當FFT長(cháng)度達到幾十萬(wàn)個(gè)點(diǎn)時(shí)，GPU效率才比較高，能夠為CPU提供有效的加速功能。但是，雷達處理應用一般是長(cháng)度較短的FFT，FFT長(cháng)度通常在512至8，192之間。

　　總之，實(shí)際的GFLOP一般只達到峰值或者理論GFLOP的一小部分。出于這一原因，更好的方法是采用算法來(lái)對比性能，這種算法能夠合理的表示典型應用的特性。隨著(zhù)基準測試算法復雜度的提高，其更能代表實(shí)際雷達系統性能。

　　算法基準測試

　　相比依靠供應商的峰值GFLOP指標來(lái)驅動(dòng)處理技術(shù)決策，另一方法是使用比較復雜的第三方評估?？諘r(shí)自適應處理(STAP)雷達常用的算法是Cholesky分解。這一算法經(jīng)常用于線(xiàn)性代數，高效的解出多個(gè)方程，可以用在相關(guān)矩陣上。

　　Cholesky算法在數值上非常復雜，要獲得合理的結果總是要求浮點(diǎn)數值表示。計算需求與N3成正比，N是矩陣維度，因此，一般對處理要求很高。雷達系統一般是實(shí)時(shí)工作，因此，要求有較高的吞吐量。結果取決于矩陣大小以及所要求的矩陣處理吞吐量，通常會(huì )超過(guò)100 GFLOP。

　　表1顯示了基于Nvidia GPU指標1.35 TFLOP的基準測試結果，使用了各種庫，以及Xilinx Virtex6 XC6VSX475T，其密度達到475K LC，這種FPGA針對DSP處理進(jìn)行了優(yōu)化。用于Cholesky基準測試時(shí)，這些器件在密度上與Altera FPGA相似。LAPACK和MAGMA是商用庫，而GPU GFLOP則是采用田納西州大學(xué)開(kāi)發(fā)的OpenCL實(shí)現的(2)。對于小規模矩陣，后者更優(yōu)化一些。

　　表1.GPU和Xilinx FPGA Cholesky基準測試 (2)

表1.GPU和Xilinx FPGA Cholesky基準測試（2）

　　Altera測試了容量中等的Altera Stratix^® V FPGA (460K邏輯單元(LE))，使用了單精度浮點(diǎn)處理的Cholesky算法。如表2所示，在Stratix V FPGA上進(jìn)行Cholesky算法的性能要比Xilinx結果高很多。Altera基準測試還包括QR分解，這是不太復雜的另一矩陣處理算法。Altera以可參數賦值內核的形式提供Cholesky和QRD算法。

　　表2.Altera FPGA Cholesky和QR基準測試

表2.Altera FPGA Cholesky和QR基準測試

　　應指出，基準測試的矩陣大小并不相同。田納西州大學(xué)的結果來(lái)自[512 × 512]的矩陣，而Altera基準測試的Cholesky是[360x360]，QRD則高達[450x450]。原因是，矩陣規模較小時(shí)，GPU效率非常低，因此，在這些應用中，不應該使用它們來(lái)加速CPU。作為對比，在規模較小的矩陣時(shí)，FPGA的工作效率非常高。雷達系統對吞吐量的要求很高，每秒數千個(gè)矩陣，因此，效率非常關(guān)鍵。采用了小矩陣，甚至要求把大矩陣分解成小矩陣以便進(jìn)行處理。

　　而且，Altera基準測試是基于每個(gè)Cholesky內核的。每個(gè)可參數賦值的Cholesky內核支持選擇矩陣大小，矢量大小和通道數量。矢量大小大致決定了FPGA資源。較大的[360 × 360]矩陣使用了較長(cháng)的矢量，支持FPGA中實(shí)現一個(gè)內核，達到91 GFLOP。較小的[60 × 60]矩陣使用的資源更少，因此，可以實(shí)現兩個(gè)內核，總共是2 × 42 = 84 GFLOP。最小的[30 × 30]矩陣支持實(shí)現三個(gè)內核，總共是3 × 25 = 75 GFLOP。

　　FPGA看起來(lái)更適合解決數據規模較小的問(wèn)題，很多雷達系統都是這種情況。GPU之所以效率低，是因為計算負載隨N3而增大，數據I/O隨N2增大，最終，隨著(zhù)數據的增加，GPU的I/O瓶頸不再是問(wèn)題。此外，隨著(zhù)矩陣規模的增大，由于每個(gè)矩陣的處理量增大，矩陣每秒吞吐量會(huì )大幅度下降。在某些點(diǎn)，吞吐量變得非常低，以至于無(wú)法滿(mǎn)足雷達系統的實(shí)時(shí)要求。

　　對于FFT，計算負載增加至N log2 N，而數據I/O隨N增大而增大。對于規模較大的數據，GPU是高效的計算引擎。作為對比，對于所有規模的數據，FPGA都是高效的計算引擎，更適合大部分雷達應用，這些應用中，FFT長(cháng)度適中，但是吞吐量很大。

fpga相關(guān)文章:fpga是什么

鎖相環(huán)相關(guān)文章:鎖相環(huán)原理

上一頁(yè) 1 2 3 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： FPGA CPU GPU GFLOP 轉換器

評論

相關(guān)推薦

Microchip推出新型DC/DC轉換器

hpnet | 2003-03-17

高速ADC與內置嵌入式串行收發(fā)器的FPGA接口

視頻 Altera FPGA ADC Linear 串行收發(fā)器 | 2009-05-19

利用強大的軟件設計工具為FPGA開(kāi)發(fā)者賦能

嵌入式系統軟件設計工具 FPGA 萊迪思 | 2024-07-17

消息稱(chēng)臺積電代工英特爾下代 AI HPC 用 GPU 芯片 Falcon Shores

EDA/PCB 臺積電英特爾 AI HPC GPU 芯片 Falcon Shores | 2024-07-17

高通新中端芯片驍龍7s Gen 3曝光：采用Adreno 810 GPU，下月發(fā)布

EDA/PCB 高通中端芯片驍龍7s Gen 3 Adreno 810 GPU | 2024-07-23

英特爾CPU故障率100％游戲商大崩潰改用AMD

消費電子英特爾 CPU 故障率游戲商 AMD | 2024-07-24

IPv6/IPv4靈活轉換器的設計

liujt_ic | 2003-03-31

實(shí)時(shí)的噪聲源定位系統

視頻 NI LabVIEW FPGA | 2009-03-25

Altera: 采用全系列40-nm收發(fā)器FPGA和ASIC實(shí)現創(chuàng )新

視頻 Altera FPGA ASIC | 2009-07-13

DC/DC轉換器設計中接地線(xiàn)的布線(xiàn)技巧

liujt_ic | 2003-03-25

目標完全替代閉源驅動(dòng)，英偉達宣布全面轉向開(kāi)源 GPU 內核模塊

嵌入式系統閉源驅動(dòng) 英偉達開(kāi)源 GPU 內核模塊 Linux | 2024-07-22

隔離放大器3656構成的任意輸入電壓轉換為4～20mA的V／I轉換器

設計方案隔離放大器構成任意輸入電壓轉換轉換器 | 2009-07-06

消息稱(chēng)英偉達曾向臺積電詢(xún)問(wèn)建設廠(chǎng)外 CoWoS 先進(jìn)封裝專(zhuān)線(xiàn)可能，遭拒絕

EDA/PCB 英偉達 GPU 封裝工藝臺積電 | 2024-07-23

s3c2410+fpga 做視頻無(wú)線(xiàn)傳輸

herbertwj | 2004-08-15

FPGA如何同DDR3存儲器進(jìn)行接口?

視頻 Altera FPGA DDR3 | 2008-06-18

Altera的FPGA下載常見(jiàn)問(wèn)題經(jīng)驗小結

資源下載 Altera FPGA 常見(jiàn)問(wèn)題經(jīng)驗 | 2007-12-13

LabVIEW 8.20技術(shù)資料大全簡(jiǎn)介

資源下載 NI LabVIEW 射頻和通信 FPGA | 2007-12-11

VFC32電壓／頻率、頻率／電壓轉換器

設計方案 VFC32 電壓頻率轉換器 | 2009-07-06

龍芯 3C6000 服務(wù)器 CPU 流片成功：性能達英特爾至強 Silver 4314 水平

網(wǎng)絡(luò )與存儲龍芯中科 CPU | 2024-07-25

LabVIEW FPGA 模塊簡(jiǎn)介

視頻 NI LabVIEW FPGA | 2009-04-01

VFC100同步電壓／頻率轉換器

設計方案 VFC100 同步電壓頻率轉換器 | 2009-07-06

用C/C++語(yǔ)言開(kāi)發(fā)大規模FPGA [轉載于www.fpga.com.cn]

xiaohua | 2002-09-24

萊迪思全新推出邏輯優(yōu)化的通用FPGA拓展其小型FPGA產(chǎn)品組合

嵌入式系統萊迪思 FPGA 小型FPGA | 2024-07-23

3-DES算法的FPGA高速實(shí)現(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

VFC62電壓／頻率、頻率／電壓轉換器

設計方案 VFC62 電壓頻率轉換器 | 2009-07-06

基于FPGA的可編程數字濾波器系統

資源下載 Max FPGA 可編程數字濾波器 | 2007-12-14

什么是 DLSS，值得嗎？

智能計算 DLSS gpu NVIDIA | 2024-07-17

3656隔離放大器構成的1～5V／4～20mA隔離轉換器

設計方案隔離放大器構成轉換器 | 2009-07-06

打破NVIDIA壟斷！英國公司實(shí)現CUDA軟件在A(yíng)MD GPU上無(wú)縫運行

智能計算 NVIDIA CUDA軟件 AMD GPU | 2024-07-22

ALTERA的PCI_IP Core問(wèn)答集

資源下載 Altera FPGA PCI_IP Core | 2007-12-13

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>