FPGA首次集成硬核浮點(diǎn)DSP,高性能計算領(lǐng)域與GPU較高下
Altera公司日前宣布在FPGA浮點(diǎn)DSP性能方面實(shí)現了重大突破。該公司首席DSP產(chǎn)品規劃經(jīng)理Michael Parker稱(chēng),Altera是第一家能夠在FPGA中集成硬核IEEE 754兼容浮點(diǎn)運算功能的可編程邏輯公司,前所未有地提高了DSP性能、邏輯效率和設計效能。根據規劃,硬核浮點(diǎn)DSP模塊將集成在正在發(fā)售的20nm Arria 10 FPGA和SoC中,也將集成在14nm Stratix 10 FPGA和SoC中,DSP設計人員可以選擇定點(diǎn)或者浮點(diǎn)模式,浮點(diǎn)模塊與現有設計后向兼容。
本文引用地址:http://dyxdggzs.com/article/201612/332420.htm面向高性能計算,與GPGPU展開(kāi)競爭
與傳統使用定點(diǎn)乘法器和FPGA邏輯來(lái)實(shí)現浮點(diǎn)功能的做法不同,Altera的硬核浮點(diǎn)DSP幾乎不使用現有FPGA浮點(diǎn)計算所需要的邏輯資源,釋放了上千個(gè)乘法器和加法器,從而一舉在A(yíng)rria 10器件中實(shí)現了1.5 TeraFLOP(每秒浮點(diǎn)運算次數)和Stratix 10器件中10 TeraFLOP的DSP性能。
“這要歸功于我們創(chuàng )新的精度可調DSP體系結構?!盇ltera公司軟件和DSP產(chǎn)品市場(chǎng)經(jīng)理Albert Chang說(shuō),在DSP模塊現有模式(標準精度定點(diǎn)模式和高精度定點(diǎn)模式)基礎上添加浮點(diǎn)模式,Altera FPGA和SoC的性能和功耗效率將在很多領(lǐng)域高于目前正在使用的微處理器和GPU,尤其是那些需要高性能計算的行業(yè)(大數據分析、石油和天然氣行業(yè)的地震建模、金融仿真、雷達和醫療成像等)。但其對定點(diǎn)模式并沒(méi)有影響(性能、大小和功耗),且對管芯總體改變<1%。
Altera方面稱(chēng),其開(kāi)發(fā)的硬核浮點(diǎn)FPGA產(chǎn)品的競爭對手并非來(lái)自同行,而是通用圖形處理單元(GPGPUs)?!捌渌鸉PGA廠(chǎng)商提供的軟核浮點(diǎn)實(shí)現方式,主要通過(guò)邏輯來(lái)實(shí)現復雜的浮點(diǎn)運算電路,是缺乏功效和競爭力的?!惫臼紫疍SP產(chǎn)品規劃經(jīng)理Michael Parker打比方說(shuō),這就好像數年前沒(méi)有硬乘法器的FPGA,卻總在試圖和現代具備DSP模塊的FPGA進(jìn)行競爭一樣可笑。
Michael Parker認為,FPGA業(yè)界目前的主要發(fā)展趨勢是提高器件的每瓦性能,而不是單純提高性能,幾乎所有客戶(hù)都面臨這一發(fā)展趨勢。未來(lái)無(wú)論何種應用,管理功耗,進(jìn)而到管理成本將是他們面臨的一個(gè)關(guān)鍵問(wèn)題。因此,具有精細粒度密集流水線(xiàn)體系結構的FPGA非常適合用作高性能計算加速器,與DSP、CPU和GPU相比,FPGA的每瓦性能是最高的。
他繼續表示:“FPGA的特點(diǎn)就是功耗低,然后又增加了硬核浮點(diǎn)運算的能力。它每瓦的功耗,或者是每個(gè)槽的功耗都是比較低的。我認為FPGA未來(lái)肯定會(huì )取代很多高端的DSP處理器。然后,它也可以取代一些GPU,因為它在功耗方面、時(shí)延方面,在連接到網(wǎng)絡(luò )的便利性方面,它都擁有優(yōu)勢?!睋嘎?,增加了硬核浮點(diǎn)功能的Arria 10 DSP性能已相當于TI最高性能DSP,也完全具備與GPGPU進(jìn)行競爭的資本。
另外,FPGA被設計為可以在高溫下工作,對于軟件編程人員來(lái)說(shuō)也是一個(gè)福音。使用了Altera的軟件,他們可以更傾向于使用這種浮點(diǎn)的,而不是定點(diǎn)的。
硬核浮點(diǎn)DSP模塊縮短6-12個(gè)月的開(kāi)發(fā)時(shí)間
由于設計人員可以將其DSP設計直接轉譯成浮點(diǎn)硬件,而不是轉換為定點(diǎn),從而大幅度縮短了時(shí)序收斂和驗證時(shí)間。相比此前系列,硬核浮點(diǎn)DSP模塊能夠縮短近12個(gè)月的開(kāi)發(fā)時(shí)間。Albert Chang認為這幫助設計人員克服了以下3方面的技術(shù)挑戰:
《國際電子商情》硬核浮點(diǎn)DSP模塊縮短6-12個(gè)月的開(kāi)發(fā)時(shí)間
首先,浮點(diǎn)設計必須手動(dòng)轉換為定點(diǎn),這需要一名非常有經(jīng)驗的工程師。即使這樣,在驗證階段也無(wú)法實(shí)現同仿真階段同樣的數值精度。
其次,對于算法的任何事后修改仍然需要手工完成。同時(shí),系統中任何針對定點(diǎn)算法的優(yōu)化步驟都無(wú)法在仿真過(guò)程中得以體現。
第三,系統集成和測試過(guò)程中出現的問(wèn)題,可能的原因大多來(lái)自下列任何一項或幾項:手動(dòng)轉換過(guò)程中的錯誤、數值精度問(wèn)題、或是算法本身就存在缺陷。找出這些問(wèn)題是非常困難的,然而,Altera的浮點(diǎn)FPGA卻能夠解決上述所有問(wèn)題。
為了幫助硬件設計人員、基于模型的設計人員以及軟件編程人員在器件中輕松實(shí)現高性能浮點(diǎn)DSP模塊,Altera還同時(shí)提供多種工具流程,包括:
* DSP Builder高級模塊庫提供了基于模型的設計流程,設計人員使用業(yè)界標準MathWorks Simulink工具在幾分鐘內就可以完成系統定義和仿真,直至系統實(shí)現。
* 對于軟件編程人員,Altera在FPGA編程中率先使用了OpenCL,并面向FPGA提供基于C語(yǔ)言的通用高級設計流程。Arria 10 FPGA浮點(diǎn)DSP模塊結合使用方便的開(kāi)發(fā)流程,為軟件編程人員提供了硬件直接轉譯方法,幫助他們縮短了開(kāi)發(fā)和驗證時(shí)間。
2014年下半年,Altera將提供面向Arria 10器件中硬核浮點(diǎn)DSP模塊的浮點(diǎn)設計流程,包括演示和基準測試。在此之前,用戶(hù)可以采用Arria 10 FPGA開(kāi)始設計,使用軟件浮點(diǎn)技術(shù)來(lái)實(shí)現浮點(diǎn)功能,在得到設計流程支持后,軟件工具會(huì )自動(dòng)(一次重新編譯)將浮點(diǎn)算法無(wú)縫映射到硬核浮點(diǎn)運算中,而不必使用軟核邏輯。
評論