<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > 如何使用一個(gè)DSP block實(shí)現4個(gè)11位浮點(diǎn)型數據乘法運算

如何使用一個(gè)DSP block實(shí)現4個(gè)11位浮點(diǎn)型數據乘法運算

作者: 時(shí)間:2018-08-14 來(lái)源:網(wǎng)絡(luò ) 收藏

  概述

本文引用地址:http://dyxdggzs.com/article/201808/390514.htm

  隨著(zhù)深度學(xué)習的發(fā)展,為了解決更加抽象,更加復雜的學(xué)習問(wèn)題,深度學(xué)習的網(wǎng)絡(luò )規模在不斷的增加,計算和數據的復雜也隨之劇增。INTEL FPGA具有高性能,可編程,低功耗等特點(diǎn),為AI應用加速提供了一種靈活、確定的低延遲、高通量、節能的解決方案。是INTELFPGA第一代集成IEEE754標準單精度硬浮點(diǎn)block,可以為高復雜度的深度學(xué)習算法提供高精度,高能效的乘法運算。

  深度學(xué)習算法復雜度高,需要進(jìn)行大量的乘法運算,如實(shí)現一個(gè)卷積核為5*5的特征提取,需要進(jìn)行25*25次乘法運算,而隨著(zhù)特征提取量的增加,乘法運算也將成倍的增長(cháng)。因此乘法器資源是實(shí)現深度學(xué)習算法的重要評估資源,本文主要介紹如何基于的一個(gè)18*18的乘法器實(shí)現兩個(gè)11*11的浮點(diǎn)mini-fp運算,從而4倍提高block資源。

  原理分析

  可變精度的Block支持配置為兩個(gè)18*18或者18*19定點(diǎn)乘法器,進(jìn)行18*18乘法運算時(shí),如圖1所示,將輸入拆分為低6位,中6位,高6位,進(jìn)行運算分析。


  圖1 18*18乘法器運算

  則對應的運算結果如下表所示:


  將中6位輸入全設為0,則可以得到對應的輸出結果如下表所示:


  當高6位及低6位為帶符號位的輸入數據時(shí),進(jìn)行符號位提取,則剩余的實(shí)際數據有效位為5位,因此低6位*高6位及高6位*低6位的乘法結果最高有效位均為10位,進(jìn)行兩個(gè)結果的加法運算,可以保證結果在12-23位以?xún)?,不?huì )對高6位*高6位乘法結果造成影響。因此Arria1018*18的乘法器支持進(jìn)行符號位提取后的兩個(gè)6*6的乘法運算,圖2是對應的仿真結果,乘法結果對應延時(shí)2個(gè)時(shí)鐘周期。


  圖2 modelsim 仿真結果

  浮點(diǎn)型數據如圖3所示,包含符號位S,指數位E及尾數位M。


  圖3 浮點(diǎn)型數據組合

  進(jìn)行浮點(diǎn)型數據乘法運算,如圖4所示。


  圖4 浮點(diǎn)型數據乘法

  需要進(jìn)行指數相加,尾數相乘,乘法結果取整及指數的調整。11位的浮點(diǎn)型數據尾數及指數各占5位,因此進(jìn)行乘法運算僅需要進(jìn)行包含符號位6位的數據相乘及對應的處理即可。Arria10的DSPblock可支持配置為2個(gè)18*18乘法器,而一個(gè)18*18的乘法器可以實(shí)現兩個(gè)6*6的乘法運算,因此一個(gè)DSPblock可以實(shí)現4個(gè)11位浮點(diǎn)型數據mini-FP的乘法運算。



關(guān)鍵詞: Arria10 DSP

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>