TigerSHARC DSP在信號處理系統中的應用
關(guān)鍵詞:TigerSHARC DSP;運算量;復位;功耗
隨著(zhù)人們對實(shí)時(shí)信號處理要求的不斷提高和大規模集成電路的迅速發(fā)展,作為數字信號處理核心和標志的數字信號處理器?DSP?芯片得到了快速的發(fā)展和應用。本文將介紹Analog Device公司的一款DSP-TigerSHARC在信號處理系統中的應用,并將對設計中的一些問(wèn)題進(jìn)行討論說(shuō)明。
1 系統設計及各部分功能簡(jiǎn)介
圖1所示是一個(gè)信號處理系統的硬件框圖。實(shí)際上,為了簡(jiǎn)化系統硬件,減少DSP片間連線(xiàn),該系統的6個(gè)DSP以松耦合的鏈路方式進(jìn)行連接。首先由DSP1通過(guò)外部DMA方式讀入中頻解調后的I、Q路數據,并由DSP1對讀入數據進(jìn)行脈沖壓縮?匹配濾波?,脈沖壓縮后進(jìn)行二次對消,以消除固定雜波。再由DSP1將處理后的數據按距離單元段通過(guò)鏈路口0、1分別發(fā)送給DSP2、DSP4。DSP2、DSP4主要進(jìn)行目標檢測?MTD?,并采用滑窗加權FFT實(shí)現窄帶多譜勒濾波器組。當DSP2、DSP4完成MTD后? 再將對應每個(gè)距離單元的16個(gè)輸出數據通過(guò)鏈路口分別送到DSP3和DSP5。之后,由DSP3、DSP5先進(jìn)行求模運算,再進(jìn)行恒虛警計算。DSP3、DSP5處理后的數據經(jīng)鏈路口傳輸到DSP6,在DSP6接到該信號后,先對距離單元內16個(gè)輸出進(jìn)行門(mén)限處理,并選擇其中最小雜波剩余值作為本單元的輸出。門(mén)限處理后,DSP6還應完成視頻積累,視頻積累采用累加求平均的方式,這樣可以避免反饋積累的拖尾現象。視頻數據以DMA方式通過(guò)外部口送出,并分別加到D/A與DS96F172等輸入端,前者產(chǎn)生模擬視頻,后者以差分形式送到顯示單元。
圖1
2?。裕椋纾澹颍樱龋粒遥?DSP簡(jiǎn)介
TigerSHARC DSP是一款高性能的靜態(tài)超標量數字信號處理器,該處理器專(zhuān)為大的信號處理和通信任務(wù)而在結構上進(jìn)行了優(yōu)化。由于該處理器將非常寬的存儲帶寬和雙運算模塊結合在一起,從而建立了數字信號處理器性能的新標準。TigerSHARC靜態(tài)超標量結構使DSP每周期能夠執行多達4條指令、24個(gè)16-bit定點(diǎn)運算和6個(gè)浮點(diǎn)運算。
該TigerSHARC DSP器件在三條相互獨立的128bit寬度的內部數據總線(xiàn)中,每條可連接三個(gè)2Mbit內部存儲器中的一個(gè),并可提供4個(gè)字的數據、指令及I/O訪(fǎng)問(wèn)和12Gbytes/s的內部存儲器帶寬。當其運行在250MHz時(shí),ADSP-TS101S的內核指令周期為4ns,同時(shí)可以提供20億次的40bit MAC運算或者500萬(wàn)次80bit MAC運算。
TigerSHARC DSP器件的主要性能如下:
●最高運行速度為250MHz,指令周期為4ns;
●帶有6Mbits片內SRAM;
●帶有雙運算模塊?每個(gè)內部包含有一個(gè)ALU、一個(gè)乘法器、一個(gè)移位器和一個(gè)寄存器組;
●具有一個(gè)外部端口、4個(gè)鏈路口和可編程標志引腳、SDRAM控制器和2個(gè)定時(shí)器;
●與用于片上仿真的IEEE1149.1標準的JTAG接口兼容;
●可通過(guò)共享總線(xiàn)無(wú)縫連接多達8個(gè)Tiger-SHARC DSP的片內總線(xiàn)仲裁。
3 系統運算量分析及計算時(shí)間估計
根據信號處理任務(wù),下面具體分析系統各組成部分的運算量,并估計所需的時(shí)間,并確定完成算法所需的DSP數目(總信號處理周期小于1000μs)。
3.1 脈沖壓縮
圖2所示是采用FFT技術(shù)實(shí)現脈沖壓縮濾波的算法框圖。若總距離單元數為1200,則需做2048點(diǎn)復數FFT。當2048點(diǎn)復數FFT完成后,還必須和預先存儲好的匹配濾波器系數H?k?相乘。一般需要做2048個(gè)復數乘法,相乘結果還需做2048點(diǎn)復數IFFT以獲得脈沖壓縮結果。TigerSHARC DSP做2048點(diǎn)復數FFT?IFFT?大約需要100μs?工作在250MHz?。因此,可以充分利用TigerSHARC DSP的雙運算塊和單指令多數據?SIMD?特點(diǎn)同時(shí)進(jìn)行兩個(gè)距離單元的復數乘法,這種方法完成2048個(gè)復數乘法僅需25μs。
固定雜波對消可以采用二次對消器來(lái)實(shí)現,其差分方程為:
y(n)=x(n)-2x(n-1)+x(n-2)
對于每個(gè)距離單元,它都需要取三個(gè)數、做兩個(gè)減法、一個(gè)加法并存儲一個(gè)數,這樣,完成1200個(gè)距離單元的二次對消大約需要25μs。因此,脈沖壓縮和固定雜波二次對消只需要一片DSP便可完成,而且還有較多時(shí)間富余。
3.2 動(dòng)目標檢測(MTD)
用FFT實(shí)現窄帶多譜勒濾波器組時(shí),為了降低旁瓣,可在系統中采用滑窗加權FFT的方法,權系數為海明權,即:
S(k)=FFT{S(n)W(n)}? ?。睿剑?1,2,…N-1
其中S(n)為雷達回波序列,而W(n)則可用下式表示:
W(n)=0.54-0.46cos[2πn/(N-1)]
?。睿剑?1,2,…N-1
TigerSHARC DSP做16點(diǎn)加權復數FFT大約需要80個(gè)指令周期?0.32μs?,因此,當距離單元數為1200時(shí),共需384μs。這樣,此滑窗多譜勒濾波器組?考慮到運算的輔助操作?僅需要兩片TigerSHARC DSP就可實(shí)現并行處理,且還有較多的富余時(shí)間。
3.3 求模
求??刹捎萌缦陆乒剑?/P>
一般情況下,求模須對每個(gè)距離單元的16個(gè)通道FFT輸出進(jìn)行運算。TigerSHARC DSP做一個(gè)16通道的求模運算需要0.5μs,距離單元數為1200時(shí),共需600μs?故可由兩片TigerSHARC DSP并行處理。
3.4 恒虛警
恒虛警算法框圖如圖3所示。
該算法可充分利用TigerSHARC DSP的雙運算模塊,同時(shí)并行處理兩個(gè)距離單元的兩個(gè)通道,完成1200個(gè)距離單元的16個(gè)通道的恒虛警計算共需500μs,故可用DSP3和DSP4并行處理。
3.5 積累
積累可采用簡(jiǎn)單累加求平均的方式,由于其計算量較少,因此,用一片TigerSHARC DSP實(shí)現仍有較大時(shí)間富余。
綜上所述,由TigerSHARC DSP構成的高速信號處理系統總共僅需6片DSP,即可對不同的距離單元段進(jìn)行并行處理。
4?。裕椋纾澹颍樱龋粒遥?DSP特殊的復位方式
TigerSHARC DSP的上電復位波形較為特殊,在設計時(shí)應充分重視,建議采用CPLD實(shí)現其復位。上電復位波形要求如圖4所示。但應注意以下幾點(diǎn):
(1)tSTART_LO在供電穩定之后必須至少大于1ms?
(2)tPULSE1_HI必須大于50個(gè)系統時(shí)鐘周期,同時(shí)小于100個(gè)系統時(shí)鐘周期;
(3)tPULSE2_LO 必須大于100個(gè)系統時(shí)鐘周期。
(4)在DSP上電后,如需正常復位,其低電平持續時(shí)間必須大于100個(gè)系統時(shí)鐘周期。
本系統采用EP1K50產(chǎn)生上電復位波形和時(shí)序控制。由于EP1K50需要一個(gè)配置芯片,而且它和DSP存在一個(gè)上電先后的問(wèn)題。也就是說(shuō),在上電后,如果CPLD芯片完成配置文件的讀入時(shí),DSP仍未上電穩定,則應充分延長(cháng)Tstart_lo的低電平時(shí)間,以避免DSP上電未穩定而CPLD上電波形已結束。因此,應保證DSP上電穩定先于CPLD芯片配置文件的讀入,此問(wèn)題在系統設計時(shí)應予以充分重視,否則DSP將無(wú)法正常工作。
5 電源供電及功耗估計
TigerSHARC DSP有三個(gè)電源,其中數字3.3V為I/O供電;數字1.2V為DSP內核供電;模擬1.2V為內部鎖相環(huán)和倍頻電路供電。TigerSHARC DSP要求數字3.3V和1.2V應同時(shí)上電。若無(wú)法嚴格同步,則應保證內核電源1.2V先上電,I/O電源3.3V后上電。本系統在數字3.3V輸入端并聯(lián)了一個(gè)大電容,而在數字1.2V輸入端并聯(lián)了一個(gè)小電容,其目的就是為了保證3.3V充電時(shí)間大于1.2V充電時(shí)間,以便很好地解決電源供電先后的問(wèn)題。
5.1 內核功耗估計
內核最大電流為1.277A,該電流是DSP進(jìn)行單指令多數據(SIMD)方式下,4個(gè)16位定點(diǎn)字乘加與兩個(gè)四字讀取并行操作以及進(jìn)行由外部口到內部存儲器DMA操作所需的電流。實(shí)際上,DSP內核電流大小還和內核工作頻率有關(guān),圖5所示是其內核電流與頻率的關(guān)系曲線(xiàn)。因此,供給DSP內核電流可根據不同的并行處理任務(wù)和內核工作頻率來(lái)確定。若并行處理較少,工作頻率低,所需電流就小。這樣,最大內核功耗為:
PDD=VDDIDD=1.21.277=1.534W
5.2 外部口功耗估計
外部口的功耗(對VDD-IO)主要是輸出引腳(例如數據線(xiàn)的某個(gè)位由高到低,或由低到高) 轉換的功率消耗,而且該功耗與系統無(wú)關(guān)。由于這種轉換的外部平均電流為0.137A,因此,功耗為:
PDD_IO=0.1370A3.3V=0.45W
6 結束語(yǔ)
本文介紹了多片TigerSHARC DSP在實(shí)時(shí)信號處理系統中的應用。該系統充分利用了TigerSHARC DSP高速的運算能力及數據吞吐量,可對不同的距離單元段進(jìn)行并行處理。文中分析了系統的運算量、所需計算時(shí)間以及完成算法所需的DSP數,并且討論了DSP應用過(guò)程中的復位,電源設計和功耗問(wèn)題,因而具有一定的工程指導意義。實(shí)踐表明,由TigerSHARC DSP構成的系統硬件結構簡(jiǎn)單,軟件編寫(xiě)容易,且成本較低。目前該系統已成功用于某雷達系統。
評論