撥開(kāi)迷霧:FPGA用做數字信號處理應用?
在2004年加入賽靈思公司之前,與大多數人的觀(guān)點(diǎn)一樣,我也認為FPGA“非常適用于原型設計,但對于批量DSP系統應用來(lái)說(shuō),成本太高,功耗太大。”,我原來(lái)一直認為,FPGA在成本和功效方面無(wú)法滿(mǎn)足今天采用DSP系統架構完成的那些設計的預算要求。然而,沒(méi)過(guò)多久,我源于“DSP視角”的看法就被大大地并且不可逆轉地改變了。
本文引用地址:http://dyxdggzs.com/article/81074.htm今天針對DSP優(yōu)化的高性能FPGA已經(jīng)在DSP領(lǐng)域扮演著(zhù)重要的角色。DSP領(lǐng)域的設計工程師逐漸發(fā)現他們所處的環(huán)境變化十分迅速,標準快速演化并且不斷融合,上市周期越來(lái)越短,設計工作受到經(jīng)濟和技術(shù)上的約束增多,但設計一旦成功獲得的回報也很巨大。
由于在性能和靈活性方面的完美組合,FPGA在DSP領(lǐng)域的應用越來(lái)越普遍(參看圖1)。諸如通信、多媒體和國防行業(yè)等高增長(cháng)的市場(chǎng)都非常需要高性能的DSP技術(shù)。這些市場(chǎng)的特點(diǎn)在于始終處于連續的變化之中,不斷變化的標準、市場(chǎng)需求、客戶(hù)需求以及競爭態(tài)勢。要跟上市場(chǎng)變化,企業(yè)就需要一種強大且靈活的處理器---FPGA就是這種特別適合的技術(shù)。

圖 1.DSP技術(shù)對比。摘自“FPGAs for DSP,第二版” © 2007 Berkeley Design Technology, Inc.瀏覽www.BDTI.com了解更多信息。
DSP市場(chǎng)研究機構Forward Concepts最近在題為“DSP戰略”的報告中,該機構分析師Will Strauss預測:未來(lái)五年內,可重配置DSP(99%是FPGA)市場(chǎng)增長(cháng)速度將超過(guò)DSP整體市場(chǎng)中的任何其它部分。Strauss還指出:FPGA經(jīng)常被用來(lái)分流承擔大量計算任務(wù),幫助提高傳統DSP芯片的能力。換句話(huà)來(lái)說(shuō),FPGA并非替代DSP。相反的是,功能和性能都不斷增強的FPGA為DSP技術(shù)開(kāi)拓了新市場(chǎng)。
將DSP性能提升到極限
推動(dòng)DSP應用對FPGA需求的最重要因素之一就是傳統處理器性能增長(cháng)放緩。盡管在摩爾定律的推動(dòng)下,處理器的制造工藝不斷向更小節點(diǎn)發(fā)展,但僅僅簡(jiǎn)單地通過(guò)減小工藝節點(diǎn)來(lái)大幅提高DSP和GPP的性能變得越來(lái)越困難。
與此同時(shí),由于通信系統將數據傳輸效率不斷推向香農定理(參見(jiàn)圖2))的上限,算法的復雜性以更快的速度提高。Turbo編碼和MIMO系統等先進(jìn)技術(shù)已經(jīng)非常接受香農定律的理論極限,成本就是極高的計算復雜性。 這就導致了算法性能要求和處理器性能之間的差距越來(lái)越大。因此,設計人員必須尋找新的設計解決方案(如DSP),在固定結構處理器之外選擇FPGA。

圖 2.FPGA填補算法復雜性和固定架構處理器效率造成的性能差距
FPGA滿(mǎn)足性能挑戰
FPGA 的DSP性能領(lǐng)先的關(guān)鍵是其內在的并行機制,即利用并行架構實(shí)現DSP功能的功能。這一并行機制使得FPGA特別適用于完成像濾波這樣的重復性DSP任務(wù)。因此,對于高度并行執行DSP任務(wù)來(lái)說(shuō),FPGA性能遠超通用DSP處理器的串行執行架構。
例如,傳統DSP處理器每個(gè)時(shí)鐘周期最多可完成8個(gè)MAC操作。要執行一個(gè)256抽頭的濾波器,傳統DSP處理器需要在1 GHz時(shí)鐘下執行 32個(gè)時(shí)鐘周期,才能達到31.25 MSPS的采樣處理性能。與此相對比,有512個(gè)并行XtremeDSP邏輯片的賽靈思Virtex-4 SX55在500 MHz時(shí)鐘下可達到500 MSPS的性能。(參看圖3)因此在時(shí)鐘慢一倍的情況下,FPGA提供的性能高了一個(gè)量級還多。

圖 3.并行實(shí)現的濾波器性能比傳統DSP串行實(shí)現時(shí)的性能高了一個(gè)量級。
顯然,實(shí)際應用不會(huì )僅僅涉及濾波,因此這一例子有點(diǎn)簡(jiǎn)單了。然而,獨立的基準測試表明,即使在實(shí)際工作負載下,FPGA也有很大的性能優(yōu)勢。
成本和功效
當然,性能并非一切:對幾乎所有DSP應用來(lái)說(shuō),成本和功率也是考慮的關(guān)鍵因素。許多設計人員仍然有這樣的錯誤印象,認為采用FPGA的成本要幾千美元。實(shí)際上,在摩爾定律的推動(dòng)下,FPGA的成本已經(jīng)大大降低,比如,2000年時(shí),百萬(wàn)系統門(mén)器件的成本為350美元,而采用90nm工藝后,成本還不到9美元。今天, FPGA產(chǎn)品已經(jīng)進(jìn)入了65nm工藝,十多種65nm 產(chǎn)品已經(jīng)上市并有幾種已經(jīng)量產(chǎn),而45nm工藝的設計工作也已在進(jìn)行中。因此,實(shí)際上FPGA現在已經(jīng)成為領(lǐng)先半導體生產(chǎn)技術(shù)的重要推動(dòng)力 – FPGA成為每個(gè)新的工藝結點(diǎn)生產(chǎn)的首批器件之一。因此,FPGA將會(huì )繼續在摩爾定律的推動(dòng)下進(jìn)一步降低成本,提高性能。
許多設計人員還認為FPGA是功耗大戶(hù)。實(shí)際上,FPGA能夠做到非常高的功效。U.C. Berkeley教授Bob Broderson在其58分鐘的教學(xué)視頻中充分表明了這一點(diǎn):“利用重配置實(shí)現通用低功耗超級計算”(“GeneralPurpose, Low Power Supercomputing Using Reconfiguration”)。在視頻教程中,Broderson教授利用國際半導體電路大會(huì )上獲得的芯片數據回顧了并行機制和功耗之間的相關(guān)性。如圖4所示,他的結論給出明確的強有力信息:FPGA同時(shí)在性能和功率效率方面領(lǐng)先于DSP。(這一點(diǎn)在BDIT 2007年1月11日的DesignLine文章中進(jìn)一步得到了證實(shí):“FPGA與DSP:有關(guān)問(wèn)題的重新審視”(FPGAs vs. DSPs: A look at the unanswered questions))

圖 4.FPGA的能源效率比通用DSP更好
近幾年來(lái),FPGA供應商始終將功耗做為優(yōu)先考慮的問(wèn)題來(lái)抓,并在65nm工藝結點(diǎn)的創(chuàng )新功率優(yōu)化技術(shù)方面投入了大量資金。事實(shí)上,一些最新的FPGA采用了與手機芯片一樣的制造工藝。
然而, DSP性能的范圍、功耗和成本要求非常寬泛,高性能DSP市場(chǎng)也需要一個(gè)DSP平臺系列來(lái)滿(mǎn)足如此廣泛的要求,單單靠一種器件無(wú)法滿(mǎn)足高端應用的極高性能要求以及大批量應用對價(jià)格和功率的要求。
FPGA平臺多元化
幾年前,FPGA供應商就開(kāi)始為高性能應用提供DSP增強的FPGA。賽靈思公司的Virtex-DSP系列就是此類(lèi)FPGA中的典型例子。今天,FPGA供應商正在推出新的低成本FPGA系列產(chǎn)品來(lái)擴充產(chǎn)品線(xiàn)。例如,賽靈思公司剛剛推出了Spartan-DSP系列。
做為兩種產(chǎn)品組合中新增加的成員,Virtex-5 SXT 和Spartan-3A DSP平臺瞄準不同的應用。Virtex-5 SXT平臺有三種器件可供選擇,主要面向要求超高DSP帶寬和更低系統成本的下一代無(wú)線(xiàn)、國防和多媒體視頻應用。這些FPGA器件在550MHz時(shí)鐘下提供了超過(guò)350 GMAC/s(即每秒3500億乘法累積運算)的性能。65-nm Virtex-5 SXT則集中于高性能,值得一提的是比此前的90nm產(chǎn)品消耗的動(dòng)態(tài)功耗低35%。
Spartan-3A DSP是賽靈思產(chǎn)品線(xiàn)中的最新成員,也是第一款DSP優(yōu)化的Spartan FPGA.Virtex-5 SXT主要集中于性能,而Spartan-3A DSP則致力于價(jià)格、性能和功耗的平衡。Spartan-3A DSP平臺以低于30美元的批量生產(chǎn)起價(jià)提供了超過(guò)30 GMAC/s的性能和高達2,200 Mbps的存儲器帶寬。這一突破性的性能價(jià)格比使其可用于以下應用:?jiǎn)瓮ǖ牢⑿⌒?pico-cell)無(wú)線(xiàn)基站中的數字前端(DFE)和基帶解決方案、軍用移動(dòng)軟件無(wú)線(xiàn)電(SDR)、超聲系統、高分辨率視頻和智能IP相機。
如圖5所示,DSP或高端FPGA無(wú)法滿(mǎn)足很多此類(lèi)應用的需要。因此Spartan-3A DSP這樣的新器件為DSP技術(shù)打開(kāi)了新市場(chǎng)。

圖 5.Spartan-DSP系列了填補DSP和高端FPGA之間的鴻溝。
前景展望
隨著(zhù)FPGA供應商對DSP應用關(guān)注的加大,其面向DSP的產(chǎn)品已經(jīng)不僅僅是提供FPGA器件。例如,賽靈思公司于2000年啟動(dòng)了“XtremeDSP”計劃,旨在為通信、多媒體和國防行業(yè)提供應用優(yōu)化的DSP解決方案。XtremeDSP方案包括:
不斷擴展為DSP設計提供的高性能器件產(chǎn)品線(xiàn)
提供開(kāi)發(fā)板和開(kāi)發(fā)套件、參考設計和知識產(chǎn)權(IP)
推出用于不同DSP系統設計的方法和設計開(kāi)發(fā)工具
提供相關(guān)的可編程邏輯、連接功能和嵌入式處理功能
建立提供培訓和支持的業(yè)界和大學(xué)戰略合作伙伴關(guān)系
DSP設計工具充分發(fā)揮FPGA威力
開(kāi)發(fā)工具特別關(guān)鍵,因此沒(méi)有強大的開(kāi)發(fā)工具就無(wú)法充分發(fā)揮FPGA的潛力。對于FPGA工具和設計方法來(lái)說(shuō),需要關(guān)注三類(lèi)不同的設計人員群體:系統設計師、DSP工程師以及FPGA/硬件工程師。每一類(lèi)設計人員有不同的職責分工,從而對他們所使用的特定設計環(huán)境提出了要求。系統設計師必須快速確定如何在選擇的處理資源條件下最好地劃分不同的系統級功能。他們關(guān)注的重點(diǎn)是選擇適當的FPGA產(chǎn)品來(lái)滿(mǎn)足產(chǎn)品性能和吞吐能力要求,同時(shí)滿(mǎn)足尺寸、成本和功耗方面的預算。 DSP工程師更關(guān)注DSP算法的創(chuàng )建和改進(jìn)。他們通常不熟悉硬件設計細節,要依賴(lài)工具將細節抽象掉,這樣他們才能夠更專(zhuān)注于更高層的設計探索和驗證。 硬件工程師通常采用VHDL 或 Verilog來(lái)從設計中獲得最高的性能。他們通過(guò)需要在同一設計環(huán)境中與更高層功能模塊以及自己的寄存器傳輸級(RTL)設計協(xié)同工作的能力,并且可以運行測試基準進(jìn)行功能和性能驗證。
現代FPGA設計工具可滿(mǎn)足所有三類(lèi)設計群體的要求,在單個(gè)設計環(huán)境中提供了系統建模、算法開(kāi)發(fā)和試驗、測試基準向量自動(dòng)生成、設計驗證和調試、以及HDL生成和仿真等功能。無(wú)論設計人員使用C/C++、MATLAB、Simulink、HDL還是他們的任意組合,當今的FPGA設計工具(包括EDA合作伙伴提供的第三方工具)都能夠支持他們快速高效地充分發(fā)揮FPGA的所有潛力。
總結
在當今要求最苛刻的數字信號處理(DSP)系統設計和開(kāi)發(fā)中, FPGA扮演著(zhù)越來(lái)越重要的角色,這一點(diǎn)并非偶然。經(jīng)過(guò)二十多年的研究和工程努力,以及與數百DSP客戶(hù)的密切合作,賽靈思FPGA已經(jīng)演化為無(wú)與倫比的高價(jià)值DSP解決方案平臺,在性能、靈活性、上市時(shí)間以及產(chǎn)品壽命方面都提升到了極高水平,同時(shí)還大大降低了總體系統成本和功耗。
因此,如果您是從事高性能DSP系統相關(guān)工作的設計師,就需要問(wèn)一下自己,“我的DSP解決方案視野里是否包括FPGA?”如果您的DSP設計正面臨性能壓力,需要降低功耗和成本,或者要加快速度趕上進(jìn)度,可能我們可以好好談?wù)劇?/p>
評論