<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > FAE講堂：如何加快處理器的正弦計算

FAE講堂：如何加快處理器的正弦計算

作者：時(shí)間：2011-05-06 來(lái)源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

　　我們使用一些Slice和乘法器，對這些硬件模塊中的兩個(gè)進(jìn)行例化。兩個(gè)內核都要求4到5個(gè)周期的延遲，以匹配我們設計的時(shí)序要求。延遲在此不是什么問(wèn)題，我們將在下面的步驟中進(jìn)行討論。

本文引用地址：http://dyxdggzs.com/article/119301.htm

　　我們將最終的IP以MicroBlaze的快速單工鏈路 (FSL) IP 的形式進(jìn)行實(shí)現。對時(shí)序的第一次估算結果表明：

　　• 將數據從MicroBlaze傳輸到FSL總線(xiàn)需用一個(gè)時(shí)鐘周期

　　• 將數據從FSL總線(xiàn)傳輸至FSL IP(當正弦計算的自變量從FSL總線(xiàn)讀出時(shí)，將立即從BRAM讀取數據，因而無(wú)需時(shí)鐘周期)需用一個(gè)時(shí)鐘周期

　　• 完成MUL運算 (cos(x)*sin(d)) 需用四個(gè)時(shí)鐘周期

　　• 將方程的結果存儲到寄存器中需用一個(gè)時(shí)鐘周期

　　• 完成ADD運算需用四個(gè)時(shí)鐘周期

　　• 將數據發(fā)送回FSL總線(xiàn)需用一個(gè)時(shí)鐘周期

　　• MicroBlaze從FSL IP讀取數據需用一個(gè)時(shí)鐘周期。

　　請注意，在沒(méi)有使用任何額外流水線(xiàn)(我們將在下一步驟中討論這一點(diǎn))的情況下，自變量數據在整個(gè)過(guò)程中必須保持穩定。這就意味著(zhù)MicroBlaze僅能請求一次正弦計算，且必須讀取該值，然后至少要等上13個(gè)時(shí)鐘周期，才能請求下一次計算。

　　因此，我們估計進(jìn)行該實(shí)現需要13個(gè)時(shí)鐘周期。當然，要處理軟件上的函數調用以及某些其他運算，還需要更多的時(shí)鐘周期。

　　我們簡(jiǎn)單地把一些標準時(shí)鐘組合在一起，不到一天就實(shí)現了該IP，隨即在硬件中對該算法進(jìn)行測量。整個(gè)算法(軟硬件混合)耗用了360個(gè)時(shí)鐘周期(包括所有的函數調用)。雖然這已是顯著(zhù)的進(jìn)步，但是仍不足以充分滿(mǎn)足客戶(hù)的需求。

　　在我們的加速器IP處理所有數據之前，我們使用一個(gè)SRL16來(lái)延遲信號的寫(xiě)入。

　　雖然該算法現在可與我們的MicroBlaze并行運行，但它每次只能計算一個(gè)值。

　　步驟六：添加流水線(xiàn)和適配客戶(hù)代碼

　　設計到了這一步，我們就可以開(kāi)始向我們的內核添加流水線(xiàn)。浮點(diǎn)ADD和浮點(diǎn)MUL的CORE Generator模塊已采用流水線(xiàn)實(shí)現，因而我們在此無(wú)需再做什么。第一個(gè)版本的算法要求自變量保持恒定，直至計算完成。在開(kāi)始新計算之前(自變量數據到達FSL IP內部)，立刻讀取兩個(gè)BRAM并執行浮點(diǎn)MUL。運算的結果在數個(gè)時(shí)鐘周期后生效。

　　我們的 sin(xi) 的自變量 xi 是一個(gè)20位寬的整數，它分為 x 和 d 兩個(gè)部分。因此，我們必須對自變量 xi的MSB部分 x 進(jìn)行幾個(gè)時(shí)鐘周期的延遲，以讀取 BRAM 的內容，存儲自變量xi，并將其與MUL運算的結果相匹配。

　　我們?yōu)槲覀兊?0位寬數值使用了少量SRL16元件(總共 10 個(gè))，共占用了10個(gè)LUT(但由于Spartan-6具有LUT組合功能，如果采用該器件較寬的LUT6結構，則僅需 5 個(gè) LUT 即可)。

　　最后的工作量相當小。在圖4中已對增加的SRL16x10位用紅圈進(jìn)行了標注。

　　

　　然后我們使用EDK向導來(lái)修改我們的FSL總線(xiàn)FIFO，以便存儲多個(gè)值(我們確定能夠存儲8個(gè)值就足以達到我們的目的，但可根據需要輕松增加更多)。

　　這就意味著(zhù)我們的客戶(hù)甚至在請求第一個(gè)結果之前即能獲得多達8個(gè)值。這足以滿(mǎn)足我們客戶(hù)當前的需求，但如果想請求更多正弦值的話(huà)，則可以輕松將FIFO緩沖參數擴展為較大的值。

　　我們在與客戶(hù)討論這種新的方案時(shí)，發(fā)現可將正弦計算進(jìn)一步劃分為兩個(gè)部分：

　　1. 請求正弦計算(fslput 運算)

　　2. 請求正弦計算的結果(fslget運算)

　　由于我們在運算中有一個(gè)固定時(shí)延，所以如果這兩個(gè)運算依次銜接、緊密地按順序執行，那么MicroBlaze將停頓，并等待FSL IP完成對請求的處理。如果能夠將這兩組運算分開(kāi)(這在客戶(hù)的算法中是可以的)，那么我們即可進(jìn)一步提

　　升運算的總體速度。通過(guò)增加流水線(xiàn)，在MicroBlaze上執行的最終代碼如下：

　　putfsl(arg1,fsl1_id);

　　putfsl(arg2,fsl1_id);

　　putfsl(arg3,fsl1_id);

　　putfsl(arg4,fsl1_id);

　　putfsl(arg5,fsl1_id);

　　putfsl(arg6,fsl1_id);

　　putfsl(arg7,fsl1_id);

　　putfsl(arg8,fsl1_id);

　　...

　　getfsl(result1,fsl1_id);

　　getfsl(result2,fsl1_id);

　　getfsl(result3,fsl1_id);

　　getfsl(result4,fsl1_id);

　　getfsl(result5,fsl1_id);

　　getfsl(result6,fsl1_id);

　　getfsl(result7,fsl1_id);

　　getfsl(result8,fsl1_id);

　　這給我們帶來(lái)了顯著(zhù)的優(yōu)勢。內核不僅可完全實(shí)現流水線(xiàn)功能，而且還能夠將正弦計算的兩個(gè)調用分開(kāi)。IP核的時(shí)延依然存在，但不再明顯。MicroBlaze也不再發(fā)生停頓和等待未完成的IP計算的情況，從而提高了整體性能。

　　客戶(hù)同意對代碼進(jìn)行相應調整，這對客戶(hù)來(lái)說(shuō)只是小量工作。通過(guò)使用C語(yǔ)言的宏命令取代函數調用，我們就能夠把所有要求的調用插入代碼庫中。

上一頁(yè) 1 2 3 下一頁(yè)

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： Xilinx 處理器 FAE

評論

相關(guān)推薦

最新的ARM技術(shù)以及嵌入式發(fā)展動(dòng)態(tài) 下

視頻 ARM Cortex RISC 處理器 | 2009-11-25

最新智能手機芯片數據：聯(lián)發(fā)科市場(chǎng)份額第一，蘋(píng)果同比下降16%

智能手機高通聯(lián)發(fā)科蘋(píng)果處理器紫光展銳 | 2024-05-23

[轉帖]IBM可編程網(wǎng)絡(luò )處理器

amine | 2002-05-17

米爾基于NXP i.MX 93開(kāi)發(fā)板的M33處理器應用開(kāi)發(fā)筆記

嵌入式系統米爾 NXP .MX 93 M33 處理器 | 2024-07-03

封閉沒(méi)有前途！Intel打造開(kāi)放AI生態(tài) 誓要虎口奪食

智能計算英特爾 AI 處理器 Lunar Lake | 2024-04-16

SRS效果處理器

設計方案效果處理器 | 2009-07-06

5分鐘學(xué)會(huì )使用CPLD

資源下載 xilinx pld 可編程邏輯器件與門(mén) 或門(mén) | 2008-01-03

透視麒麟9010：博采眾長(cháng)但依舊任重道遠

手機與無(wú)線(xiàn)通信麒麟9010 Pura 70 處理器 Arm TCS23 Firestorm 鴻蒙NEXT | 2024-04-23

高通被曝開(kāi)發(fā)低成本驍龍 WoA 芯片：AI 算力 40 TOPS、2025Q4 推出

智能計算高通 WoA 處理器 | 2024-06-18

英特爾先進(jìn)封裝產(chǎn)能也吃緊，影響第二季AI PC處理器供應

消費電子英特爾先進(jìn)封裝 AI PC 處理器 | 2024-05-01

基于GP4020的GPS接收機基帶處理器電路

設計方案基于 GP4020 接收機基帶處理器 | 2009-07-06

嵌入式系統綜述之二(老站轉)

amine | 2002-05-18

運放型BBE處理器

設計方案運放型處理器 | 2009-07-06

嵌入式處理器選型上

視頻嵌入式 ARM 處理器 CN896 MIPS | 2009-10-27

《用CPLD配置Spartan II器件》的附加說(shuō)明

資源下載 Xilinx Spartan II CPLD配置 | 2007-12-13

中國臺灣AI關(guān)鍵組件的發(fā)展現況與布局

智能計算 IC設計 PCB 散熱處理器內存 AI | 2024-06-13

嵌入式系統綜述之三(老站轉)

amine | 2002-05-18

嵌入式系統硬件接口設計上

視頻嵌入式 Xscale 處理器 S3C2410 | 2009-10-27

拆解：三星Galaxy Watch 7中的Exynos W1000處理器3nm GAA工藝

消費電子三星 Galaxy Watch 7 Exynos W1000 處理器 3nm GAA | 2024-07-19

嵌入式處理器選型下

視頻嵌入式 ARM 處理器 MIPS PXA27x | 2009-10-27

3-DES算法的FPGA高速實(shí)現(Xilinx)

資源下載 Xilinx FPGA 3-DES算法 | 2007-12-13

德州儀器推出用于OMAPTM無(wú)線(xiàn)處理器的新型開(kāi)發(fā)套件

hpnet | 2002-06-03

貿澤開(kāi)售AMD / Xilinx Alveo MA35D媒體加速器

智能計算貿澤 Xilinx Alveo 媒體加速器 | 2024-07-11

對數壓縮方式數字音頻處理器(DAC76、MN5110)

設計方案對數壓縮方式數字音頻處理器 DAC76 MN511 | 2009-07-06

Microchip發(fā)布多核64位微處理器系列產(chǎn)品進(jìn)一步擴展處理器產(chǎn)品線(xiàn)

嵌入式系統 Microchip 64位微處理器處理器 | 2024-07-10

程控開(kāi)關(guān)電源用于片心邏輯―Pentium Pro處理器

設計方案程控開(kāi)關(guān)電源用于片心邏輯 Pentium 處理器 | 2009-07-06

Lisatek推出嵌入式處理器設計工具（摘自www.embed.com.cn）

xiaohua | 2002-06-17

中文文章：怎樣寫(xiě)testbench（xilinx的）

資源下載 xilinx testbench 書(shū)寫(xiě)技巧 | 2007-12-13

嵌入式系統硬件接口設計下

視頻嵌入式處理器 SPI EP9315 S3C2410 | 2009-10-27

Nios II 處理器中文小冊子（altera）

資源下載 altera Nios II 處理器中文小冊子 | 2007-12-12

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>