<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 浮點(diǎn)矩陣相乘IP核并行改進(jìn)的設計與實(shí)現

浮點(diǎn)矩陣相乘IP核并行改進(jìn)的設計與實(shí)現

作者：時(shí)間：2017-06-05 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

嵌入式計算作為新一代計算系統的高效運行方式，應用于多個(gè)高性能領(lǐng)域，如陣列信號處理、核武器模擬、計算流體動(dòng)力學(xué)等。在這些科學(xué)計算中，需要大量的浮點(diǎn)矩陣運算。而目前已實(shí)現的浮點(diǎn)矩陣運算是直接使用VHDL語(yǔ)言編寫(xiě)的浮點(diǎn)矩陣相乘處理單元[1]，其關(guān)鍵技術(shù)是乘累加單元的設計，這樣設計的硬件，其性能依賴(lài)于設計者的編程水平。此外，FPGA廠(chǎng)商也推出了一定規模的浮點(diǎn)矩陣運算IP核[2]，雖然此IP核應用了本廠(chǎng)家的器件，并經(jīng)過(guò)專(zhuān)業(yè)調試和硬件實(shí)測，性能穩定且優(yōu)于手寫(xiě)代碼，但仍可對其進(jìn)行改進(jìn)，以進(jìn)一步提高運算速度。

1 Altera浮點(diǎn)矩陣相乘IP核原理

Altera公司推出的浮點(diǎn)矩陣相乘IP核ALTFP_MATRIX_MULT，是在Quartus軟件9.1版本以上的環(huán)境中使用，能夠進(jìn)行一定規模的浮點(diǎn)矩陣相乘運算，包含A、B矩陣數據輸入，數據浮點(diǎn)乘加，數據緩存及相加輸出四大部分。其中最能體現浮點(diǎn)計算性能的是浮點(diǎn)乘加部分，而周?chē)目刂齐娐芳拜敵鰟t影響到系統的最高時(shí)鐘頻率，間接地影響系統整體性能。

整個(gè)矩陣相乘電路原理是將輸入的單路數據（A、B矩陣共用數據線(xiàn)），通過(guò)控制器產(chǎn)生A、B矩陣地址信號，控制著(zhù)A矩陣數據輸出和B矩陣數據輸出，并將數據并行分段輸出到浮點(diǎn)乘加模塊進(jìn)行乘加運算，之后串行輸出到一個(gè)緩存器模塊中，再以并行方式輸出到浮點(diǎn)相加模塊，最后獲得計算結果。從其原理可以看出，在數據輸入輸出方面仍有許多可改進(jìn)的地方。

2 IP核存在的缺陷及改進(jìn)

2.1 存在缺陷

(1)輸入數據帶寬的不均衡性。在矩陣A、B的數據輸入時(shí)，Altera的IP核將A矩陣數據存于M144K的Block RAM中，而將B矩陣數據存于M9K的Block RAM中，導致IP核中A矩陣數據的帶寬小于B矩陣數據的帶寬，并需要一定數量的寄存器組使A矩陣數據帶寬能夠匹配于B矩陣數據帶寬。由此可見(jiàn)，A、B矩陣數據的存儲受到器件限制和存儲約束，同時(shí)由于在浮點(diǎn)乘加模塊的輸入端（A、B矩陣數據）帶寬不同，造成A矩陣數據的輸入需要額外的處理時(shí)間。

(2)加載數據的不連貫性。在矩陣數據加載時(shí)，IP核通過(guò)將數據分段成等分的幾部分，用于向量相乘。由于矩陣A存儲帶寬窄需要4步寄存（由Blocks決定），在第3個(gè)周期時(shí)才加載數據B用于計算，送到一個(gè)FIFO中存儲；在第6個(gè)時(shí)鐘周期時(shí)加載矩陣A分段的第二部分進(jìn)行各自的第二部分計算，最后當計算到第15個(gè)周期時(shí)，才可通過(guò)浮點(diǎn)相加，計算出矩陣C的第一個(gè)值，之后計算出矩陣C的其他值C11。從上述結構可見(jiàn)，在分段相乘之后，采用先對一個(gè)FIFO進(jìn)行存儲，存滿(mǎn)后再對下一個(gè)數據FIFO進(jìn)行存儲，造成時(shí)間上浪費過(guò)多。

2.2 設計改進(jìn)

鑒于上述缺陷，在輸入A、B矩陣的存儲方式上，進(jìn)行串行輸入到并行輸入的改進(jìn)，使得兩個(gè)矩陣能同步輸入到浮點(diǎn)乘加模塊。在數據加載方式上，將A矩陣用3個(gè)周期加載完畢，再處理相乘運算；將分段相乘結果進(jìn)行直接存儲相加，獲得C矩陣的第一個(gè)值，縮減運算時(shí)間。設計的改進(jìn)框圖如圖1所示。

浮點(diǎn)矩陣相乘IP核并行改進(jìn)的設計與實(shí)現.pdf

本文引用地址：http://dyxdggzs.com/article/201706/348878.htm

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： IP核 浮點(diǎn)矩陣運算 存儲方式

評論

相關(guān)推薦

Altera系列FPGA芯片IP核詳解.pdf

zxopenljx | 2020-07-23

一種新型的LCD驅動(dòng)電路IP核的總體設計

嵌入式系統 IP核驅動(dòng)電路 LCD | 2017-10-21

FFT變換的IP核的源代碼.zip

zxopenljx | 2021-01-15

一種可進(jìn)化IP核的設計和實(shí)現

資源下載可進(jìn)化 IP核設計實(shí)現 | 2007-04-19

I2C器件接口IP核的CPLD設計

資源下載可編程邏輯器件 I2C串行擴展 IP核 | 2007-10-30

NVIDIA選用新思科技經(jīng)驗證DesignWare DDR IP核

智能計算云計算 NVIDIA 新思科技 DesignWare DDR IP核 | 2020-08-12

基于IP核的PCI Express接口設計

手機與無(wú)線(xiàn)通信現場(chǎng)可編程門(mén)陣列 DMA控制器 IP核 | 2018-08-29

基于Zynq的OLED驅動(dòng)設計

設計方案 Zynq器件人機交互 ARM IP核 OLED | 2015-06-05

FPGA實(shí)戰開(kāi)發(fā)技巧（13）

嵌入式系統 FPGA 賽靈思 IP核 | 2017-10-13

一種節能型可升級異步FIFO的FPGA實(shí)現

設計方案 IP核異步FIFO FPGA | 2015-03-24

做好了的IP核DE2I2 Sound

資源下載 IP核 DE2I2 Sound | 2007-04-19

FPGA開(kāi)發(fā)之IP核：軟核、硬核以及固核概念

嵌入式系統 FPGA IP核固核概念 | 2018-08-08

JPEG2000編碼器IP核設計，包括具體算法與結構

設計方案 JPEG2000 編碼器 IP核開(kāi)放源碼 | 2015-03-22

基于FPGA的信息安全系統設計

設計方案信息安全系統 RAM IP核 FPGA | 2015-07-08

MCU與USB設備控制器IP核的設計

設計方案 USB設備控制器 MCU IP核 | 2015-06-23

GPIB控制器軟件的IP核設計方案詳解

嵌入式系統 IP核 GPIB | 2017-10-21

如何設計基于A(yíng)valon總線(xiàn)的可配置LCD控制器IP核？

嵌入式系統 Avalon總線(xiàn) LCD控制器 IP核 | 2018-08-02

基于IP核的多UART擴展及其FPGA實(shí)現

zxopenljx | 2020-04-05

IP核互連策略及規范

資源下載 IP核互連策略及規范 | 2007-09-13

一種基于PCI IP核的碼流接收卡的設計

資源下載 DVB 異步串行接口 PCI IP核 | 2007-10-10

Arm中國大裁員：SoC、HPC兩團隊被裁人數最多

嵌入式系統 ARM中國芯片架構 IP核 SOC 裁員 | 2023-02-13

Cadence發(fā)布首款面向AI語(yǔ)音及音頻處理優(yōu)化的DSP產(chǎn)品—Tensilica HiFi 5 DSP

智能計算 HiFi 5 IP核 | 2018-11-14

基于A(yíng)RM Cortex-M3的SoC系統設計

FPGA IP核 Cortex-M3 SoC 201902 | 2019-01-29

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>