<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > EDA/PCB > 設計應用 > 充分發(fā)揮FPGA浮點(diǎn)IP內核的優(yōu)勢

充分發(fā)揮FPGA浮點(diǎn)IP內核的優(yōu)勢

作者: 時(shí)間:2009-12-07 來(lái)源:網(wǎng)絡(luò ) 收藏

表 1. 單精度矩陣乘法性能結果

MatrixAA大小
MatrixBB大小
Vectorsize
使用的邏輯
GFLOPSf MAX (MHz)
功耗 (mW)
ALM (1)
DSP使用 (2)
M9KM144K
存儲器 (bits)
靜態(tài)
動(dòng)態(tài)
I/O
總計
36x112 112x36 8 4,604 32 43 2 576,200 4 291 2,008 1,063 300 3,334
36x224 224x36 16 7,882 64 77 4 1,101,920 9 291 2,045 1,821 300 4,165
36x448 448x36 32 14,257 128 137 8 2,153,040 18 291 2,110 3,448 300 5,858
64x64 64x64 32 13,154 128 41 8 1,333,233 18 292 2,112 2,604 306 5,023
128x128 128x128 64 25,636 256 141 16 3,173,189 37 293 2,244 5,384 306 7,934

注釋?zhuān)?

(1) 自適應邏輯模塊
(2) 18x18 DSP模塊
使用 Quartus II功耗估算器,很容易計算得到實(shí)際的每瓦每秒 giga結果 (GFLOPS/W)。使用 Altera.
Stratix. IV EP4SE230 部分資源時(shí),結果達到了 5 GFLOPS/W。使用 Stratix IV EP4SE530器件中更大的
矩陣乘法內核,結果大約為 7 GFLOPS/W,計算密度為 200 GFLOPS。利用整個(gè)器件實(shí)現大規模算法
時(shí),分散了 靜態(tài)功耗,效率非常高。

Altera開(kāi)發(fā)的技術(shù)大大降低了實(shí)現大規模浮點(diǎn)數據通路的邏輯和布線(xiàn)資源要求。使用浮點(diǎn)數據通路優(yōu)化
工具非常關(guān)鍵,對資源要求的降低使得單位浮點(diǎn)邏輯/布線(xiàn)運算比達到了高端 的水平。這反映在工
具能夠實(shí)現接近 300 MHz的 fMAX,與例化的矩陣乘法規模無(wú)關(guān)。通過(guò)這種方式,在大規模浮點(diǎn)設計中,用
戶(hù)能夠可靠的使用 FPGA 80%以上的資源,實(shí)現大于 200-MHz的 fMAX性能。

矩陣求逆
FPGA中浮點(diǎn)算法最常見(jiàn)的應用是矩陣求逆。大部分無(wú)線(xiàn)多輸入多輸出 (MIMO)算法、雷達 STAP系統、醫療
成像聚束和很多高性能計算應用都需要進(jìn)行矩陣求逆。參數賦值矩陣求逆浮點(diǎn) 的實(shí)例性能 (表2)
顯示了非常高的矩陣吞吐量。 4x4矩陣求逆內核能夠進(jìn)行每秒 2千萬(wàn)次矩陣求逆運算,速度足以支持 LTE
無(wú)線(xiàn) MIMO應用。

表 2. 單精度浮點(diǎn)矩陣求逆 (Cholesky算法 )性能

快速傅立葉變換
FFT是另一種大動(dòng)態(tài)范圍應用實(shí)例。由于 FFT算法的內在特性,位精度一般會(huì )隨著(zhù) FFT長(cháng)度增加而增大。某些應用使用級聯(lián) FFT,需要更大的動(dòng)態(tài)范圍。很多雷達應用使用 FFT進(jìn)行定點(diǎn)算法,裝入測距數據。這一般還需要第二次 FFT,裝入多普勒測距數據,動(dòng)態(tài)范圍足夠高,需要采用浮點(diǎn)算法。如圖3和圖4所示,相對于定點(diǎn)算法,需要增加邏輯以實(shí)現單精度浮點(diǎn)算法,而電路 fMAX、存儲器和乘法器基本相似。


充分發(fā)揮 FPGA浮點(diǎn) 的優(yōu)勢 Altera公司

圖3. FFT邏輯和寄存器使用對比

結論
Altera新的浮點(diǎn)電路優(yōu)化技術(shù)集成到浮點(diǎn) 中,同時(shí)提高了密度,并提供更多的邏輯資源,實(shí)現了優(yōu)異
的 FPGA浮點(diǎn)性能。其他供應商提供專(zhuān)用浮點(diǎn)處理器解決方案,但是,大部分都達不到 Altera FPGA解決
方案的 GFLOPS高性能水平,而且沒(méi)有一個(gè)能夠實(shí)現 Stratix IV FPGA解決方案的 GFLOP/W性能。國家科
學(xué)基金會(huì ) (NSF)高性能配置計算中心 (CHREC)的獨立基準測試證明了這一點(diǎn),認為 Stratix IV EP4SE530雙
精度浮點(diǎn)處理的性能最好。

Altera FPGA的其他優(yōu)點(diǎn)包括業(yè)界領(lǐng)先的外部存儲器帶寬資源以及性能達到 12.5 Gbps的SERDES收發(fā)器等。
FPGA平臺還提供性能最好的定點(diǎn)數據通路,實(shí)現了非常靈活的 I/O和存儲器接口。通過(guò)這些功能, Stratix
IV FPGA成為構建高性能浮點(diǎn)數據通路的理想平臺,可以用在多種應用中,從高性能計算到雷達和電子戰,
直至基于 MIMO的 SDR/無(wú)線(xiàn)系統,以及無(wú)線(xiàn)聚束應用等。



上一頁(yè) 1 2 下一頁(yè)

關(guān)鍵詞: FPGA 浮點(diǎn) IP內核

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>