FPGA將成為傳統DSP的有力挑戰
寬帶革命
市場(chǎng)環(huán)境的變化將會(huì )改變未來(lái)幾年內DSP實(shí)現的方式。最顯著(zhù)地,寬帶革命將帶來(lái)最大的挑戰。
寬帶革命是由傳統上分別屬于不同領(lǐng)域的許多技術(shù)的融合所引發(fā)。其中包括計算、電信/無(wú)線(xiàn)、視頻、圖像和網(wǎng)絡(luò )等。圖1突出了由這一融合而新產(chǎn)生的一些新應用。
此類(lèi)新興應用需要處理的模擬和數字數據量呈指數型增長(cháng)。這又進(jìn)一步加大了對更快的DSP的需求。雖然摩爾定律仍適用于目前最快的DSP,但在所需要的性能水平與實(shí)際DSP器件所提供性能水平間的差距仍在不斷增大(參看圖2)。因此很明顯,DSP要滿(mǎn)足寬帶革命所提出的挑戰必須尋求新的數據處理方法。
此外,今天快速變化的市場(chǎng)上,產(chǎn)品上市時(shí)間縮短。同時(shí)由于競爭產(chǎn)品跟上的速度更快,因此產(chǎn)品量產(chǎn)階段更短。所以,上市時(shí)間變得更為關(guān)鍵,FPGA供應商很早就意識到了這一點(diǎn)。過(guò)去上市晚僅僅是利潤少一些,今天則意味著(zhù)根本沒(méi)有利潤,甚至某些情況下是生意徹底失??!
這意味著(zhù)DSP需要足夠靈活以滿(mǎn)足不斷縮短的上市時(shí)間要求。
采用FPGA實(shí)現高性能DSP
主流制造商,如TI、ADI和Motorola,生產(chǎn)的傳統DSP有通用產(chǎn)品或特殊應用標準產(chǎn)品(ASSP)。通用DSP的優(yōu)點(diǎn)是通過(guò)編程可以應用在廣泛的產(chǎn)品中。而特殊應用產(chǎn)品則是針對特定的應用而開(kāi)發(fā)的,如ADSL調制解調器(帶DSP核心的ASSP),或針對特定客戶(hù)而開(kāi)發(fā)(帶DSP核心的ASIC)。在性能要求較低的應用中,甚至也可利用微處理器作為DSP。
傳統通用DSP采用馮-諾依曼(Von Neumann)結構,或某種類(lèi)型的擴展。此類(lèi)結構本質(zhì)上是串行的,因此性能受到一定的限制。傳統DSP中的乘法和累加(MAC)部件通常是共享資源的。
FIR濾波器對輸入信號進(jìn)行濾波,其方法是將每一輸入信號數據樣本與幾個(gè)恒定數值(系統)相乘,然后對結果進(jìn)行累加。加到輸入信號上的MAC操作越多,濾波器越精確。例如,256階FIR濾波器中對每個(gè)數據樣本需要進(jìn)行256次MAC操作,然后才能處理下一個(gè)樣本。
FPGA供應商在其產(chǎn)品中也提供了DSP功能。例如,世界上的許多手機基站產(chǎn)品采用了Xilinx公司Virtex-E FPGA。為了建立大量的連接,手機基站需要處理大量的數據,其中大部分是采用某種DSP實(shí)現的。
FPGA提供的DSP性能已超過(guò)1280億MAC每秒,大大高于目前主流供應商所能提供的傳統DSP的性能。Virtex-II可以提供6千億MAC每秒的性能。為達到這樣的性能,FPGA采用了多路并行結構處理輸入信號(參看圖3)。
采用這種并行結構,256階FIR濾波器中的每個(gè)樣本可以在一個(gè)時(shí)鐘周期內處理完,因此極大地改善了DSP的性能和效率。
PLD中嵌入DSP
很多PLD廠(chǎng)商開(kāi)始采取行動(dòng)。Xilinx作為世界可編程邏輯器件的領(lǐng)導廠(chǎng)商,擁有先進(jìn)的FPGA技術(shù)以及先進(jìn)的開(kāi)發(fā)工具。2000年11月,推出DSP行動(dòng),試圖進(jìn)入這一市場(chǎng)。
Xilinx XtremeDSP行動(dòng)的目標是希望滿(mǎn)足寬帶革命的高性能挑戰。其它特性還包括根據如芯片面積(相應于使用的資源)和系統頻率來(lái)優(yōu)化DSP設計。XtremeDSP行動(dòng)還推出了一些開(kāi)發(fā)工具可彌補傳統上在DSP和FPGA設計方法間存在的差距。
Virtex-II提供的性能包括:
·千萬(wàn)門(mén)FPGA結構允許實(shí)現大量的并行處理。
·最多達192(18×18)個(gè)嵌入式乘法器,工作頻率依字大小不同最高可達250MHz,可在最小的芯片面積上實(shí)現快速無(wú)延遲乘法操作。
·最多3.5M位完全雙口塊RAM,可優(yōu)化數據緩沖和存儲。
新的Virtex-II系列的增強結構使其在實(shí)現需要計算的算法時(shí)具有獨特的優(yōu)勢。Xilinx提供的測試數據表明,Xilinx FPGA比業(yè)界最快的DSP運行要快100倍。因此,單個(gè)FPGA即可代替傳統上所謂的DSP處理器陣列。
傳統上基于SRAM的FPGA具有現場(chǎng)容易改變和升級的靈活性,除此以外,XtremeDSP還增加了如下性能。
兩個(gè)這樣的新性能即是分布式資源和分段布線(xiàn)(segmented routing)。
·分布式DSP資源——這使設計者可以根據算法和性能要求改變DSP結構,從而達到面積/成本或性能/系統頻率最優(yōu)的設計。
·分段布線(xiàn)(采用動(dòng)態(tài)互連)——可保證與器件大小和集成到FPGA中的其它系統功能無(wú)關(guān),始終達到最高的性能。
Xilinx XtremeDSP計劃中最令人心動(dòng)的方面可能就是能夠提高生產(chǎn)率。XtremeDSP計劃縮短了FPGA DSP設計周期。將主要通過(guò)配合Simulink使用的MathWorks系統生成器和濾波器生成器來(lái)實(shí)現。
·Simulink系統生成器——傳統上FPGA和DSP的設計流程非常不同。利用與MathWorks的伙伴關(guān)系,Xilinx開(kāi)發(fā)的系統生成器填補了FPGA和傳統DSP設計流程間的差距。
·濾波器生成器——如前面所述,數字濾波器是DSP最經(jīng)常的用途。一系列DSP供應商提供了濾波器生成器以加快漫長(cháng)的濾波器設計過(guò)程。然而,目前市面的FPGA濾波器生成器要么只能生成完全串行(即生成芯片面積最小但性能最低的實(shí)施方案)的濾波器或完全并行(生成性能最高但芯片面積效率最低的實(shí)施方案)的濾波器。然后,多數的DSP設計并不是需要完全串行或完全并行的實(shí)施方案,而是介于其中的混合方案。Xilinx濾波器生成器是約束條件驅動(dòng)的,可以根據給定的性能級別或并行程度生成占用資源最優(yōu)的實(shí)施方案。
評論