<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > FPGA 解決方案和標準控制器內核比較

FPGA 解決方案和標準控制器內核比較

作者: 時(shí)間:2012-01-07 來(lái)源:網(wǎng)絡(luò ) 收藏

 MicroBlaze處理器是賽靈思(Xilinx)在嵌入式開(kāi)發(fā)套件 (EDK) 中提供的兩款32位之一,是實(shí)現硬件加速的靈活工具。圖1是MicroBlaze的典型設計。該含有一個(gè)32位乘法器,但不含浮點(diǎn)單元(FPU)、桶式移位器或專(zhuān)用硬件加速器。對Xilinx公司Spartan 器件而言,默認系統含有區域優(yōu)化的MicroBlaze(采用三級流水線(xiàn)),但大多數客戶(hù)通常在開(kāi)始時(shí)使用速度優(yōu)化版(采用五級流水線(xiàn))進(jìn)行性能評估,其優(yōu)點(diǎn)是小巧簡(jiǎn)潔,易于擴展。

本文引用地址:http://dyxdggzs.com/article/149841.htm

  Xilinx客戶(hù)針對這種處理器設計所要求的兩個(gè)實(shí)際應用案例可說(shuō)明MicroBlaze在硬件加速方面的作用。本文以 Spartan 器件為重點(diǎn), ,展現我們能夠達到的性?xún)r(jià)比。這一方法同樣適用于Virtex 。

  案例1:實(shí)施位反轉算法

  在第一個(gè)應用示例中,假定MicroBlaze處理器的運行速度僅為50MHz。采用 Spartan-3或Spartan-6器件可輕松實(shí)現這一速度。諸如本地存儲器總線(xiàn)(指令和數據,LMB)以及處理器本機總線(xiàn)(PLB)等所有內部總線(xiàn)的運行速度均達到50MHz。為簡(jiǎn)單起見(jiàn),假定沒(méi)有連接外部DDR存儲器。

  現在假設客戶(hù)想要在這個(gè)CPU上實(shí)施位反轉算法。MicroBlaze自身沒(méi)有通過(guò)硬件直接提供這個(gè)功能。再假定每秒需要完成2萬(wàn)次位反轉操作。

  要解決這個(gè)問(wèn)題,大多數客戶(hù)首先會(huì )采用純軟件方案,因為這樣可輕松地實(shí)現想要的功能。而且如果性能足夠高,無(wú)需進(jìn)行任何修改。

  為此,讓我們先從簡(jiǎn)單的軟件算法出發(fā),實(shí)施簡(jiǎn)短精悍的。結果確實(shí)簡(jiǎn)單、精巧而且容易理解,不過(guò)效率很低。
unsigned int v=value;
unsigned int r = v;
int s = sizeof(v) * CHAR_BIT - 1;
for (v >>= 1; v; v >>= 1)
{
r = 1;
r |= v 1;
s--;
}
r = s;
return r;

  這段程序運行相當順利,不過(guò)就算在專(zhuān)門(mén)針對速度優(yōu)化的MicroBlaze(使用五級流水線(xiàn))上運行處理一個(gè)32 位字的算法,也用了220個(gè)周期。要執行2萬(wàn)次位反轉操作,在速度為50MHz的MicroBlaze上約需88ms。

  客戶(hù)試圖采用略有不同的方法來(lái)優(yōu)化算法,但仍作為純軟件來(lái)實(shí)施。

  要進(jìn)一步提升性能,就要采用純硬件解決方案,通過(guò)一種新的方式來(lái)讓硬件加速器充分發(fā)揮性能。

 為了加速這種基礎操作,只需要在MicroBlaze快速單工鏈路(FSL)上連接一個(gè)非常簡(jiǎn)單的內核。FSL實(shí)施方案使用FSL總線(xiàn)(包括同步或異步FIFO)將數據從 MicroBlaze內核傳輸到FSL 硬件加速器IP核。帶FIFO 的FSL總線(xiàn)與FIFO可對上述兩者間的數據存取進(jìn)行去耦。

  如果采用帶FIFO的FSL總線(xiàn),則一般情況下執行時(shí)間為4個(gè)周期:一個(gè)周期用來(lái)將MicroBlaze上的數據通過(guò)FSL寫(xiě)入FIFO;一個(gè)周期用來(lái)將數據從FIFO 傳輸到FSL IP;一個(gè)周期用來(lái)把結果從FSL IP傳送回 FSL總線(xiàn)的FIFO中;最后一個(gè)周期則負責從FSL總線(xiàn)讀出結果并傳輸至 MicroBlaze。

  MicroBlaze到FSL總線(xiàn)的連接以及FSL總線(xiàn)到FSL IP的連接可在EDK的圖形視圖中輕松創(chuàng )建。

  這樣代碼要長(cháng)得多,效率也有大幅度提升,但時(shí)間還是太長(cháng)了,執行2萬(wàn)次操作現在仍然大概需要52ms。

  隨后客戶(hù)在互聯(lián)網(wǎng)上進(jìn)行了一些調查,找到一種更好的算法,把代碼改編為:

unsigned x = value;
unsigned r;
x = (((x 0xaaaaaaaa) >> 1) | ((x
0x55555555) 1));
x = (((x 0xcccccccc) >> 2) | ((x
0x33333333) 2));
 x = (((x 0xf0f0f0f0) >> 4) | ((x
0x0f0f0f0f) 4));
 x = (((x 0xff00ff00) >> 8) | ((x
0x00ff00ff) 8));
 r = ((x >> 16) | (x 16));
 return r;

  這個(gè)代碼看起來(lái)效率高,短小精悍。而且它不需要會(huì )造成流水線(xiàn)中斷的分支。它在這個(gè)核心系統上運行只需29 個(gè)周期。

  不過(guò)這個(gè)算法需要在1 、2、4、8和16位之間進(jìn)行移位操作。我們在MicroBlaze的屬性窗口中激活桶式移位器。不管移位操作的長(cháng)度如何,采用桶式移位器可允許我們在一個(gè)周期內完成移位指令。這樣可以讓純軟件算法在 MicroBlaze上運行得稍快一些。

  激活MicroBlaze硬件上的桶式移位器可將處理算法所需時(shí)間縮短到22個(gè)周期。與第一個(gè)版本的軟件算法相比,此算法得到了顯著(zhù)改善。目前采用此算法,執行所有 2萬(wàn)次操作只需8.8ms,效率提升了10倍,不過(guò)仍未達到客戶(hù)要求。

  不過(guò)效率還有提升的空間。算法中的時(shí)延非常關(guān)鍵,應盡可能地縮短。但在我們的實(shí)施方案中,采用兩根FSL總線(xiàn)仍需要四個(gè)時(shí)鐘周期。不過(guò)我們可以通過(guò)將 MicroBlaze與硬件加速器之間的現有連接方式改為直接連接,便可將時(shí)延減半,縮短至兩個(gè)時(shí)鐘周期。這樣一個(gè)周期用于將數據寫(xiě)入 FSL硬件加速器IP,而另一個(gè)周期則負責讀回結果。

  在采用直接連接方式時(shí),需注意幾個(gè)問(wèn)題。首先,協(xié)處理器IP應存儲輸入,并以寄存方式提供結果。請注意在執行此操作時(shí)沒(méi)有使用帶FIFO的FSL總線(xiàn)。

  此外,以不同時(shí)鐘速率運行 MicroBlaze和FSL硬件加速器IP 容易發(fā)生問(wèn)題。為避免發(fā)生沖突,設計人員最好將MicroBlaze和 FSL硬件加速器IP的運行速率設為一致。

  不過(guò),如何在不使用FSL總線(xiàn)的情況下將MicroBlaze和FSL硬件加速器IP直接連接起來(lái)呢?這很簡(jiǎn)單,只需將MicroBlaze和硬件加速器的數據線(xiàn)連接起來(lái)即可。如果需要,可再添加握手信號。

  例如,使用位反轉IP,只需一個(gè)寫(xiě)入信號即可。IP會(huì )一直很快運行,足以對MicroBlaze的任何請求做出及時(shí)響應。

  IP本身非常簡(jiǎn)單。以下是摘錄 VHDL 代碼中的一段:

architecture behavioral of
  fsl_bitrev is
  -- data value sent by microblaze:
  signal data_value :
std_logic_vector(0 to 31) := (others=>'0');
begin
  -- bitreversed value to write back:
FSL_M_Data = data_value;
process(FSL_Clk)
begin
  if rising_edge(FSL_CLK) then
if (FSL_S_Exists = '1') then
-- create the bitreversed data:
data_value(0) = FSL_S_Data(31);
data_value(1) = FSL_S_Data(30);
data_value(2) = FSL_S_Data(29);
...
 data_value(30) = FSL_S_Data(1);
 data_value(31) = FSL_S_Data(0);
end if;
end if;
end process;
end architecture behavioral;


上一頁(yè) 1 2 下一頁(yè)

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>