LTE系統中FFT的研究與DSP實(shí)現
在數字信號處理中,離散傅里葉變換(DFT)是常用的變換方法,它在各種數字信號處理系統中扮演著(zhù)重要的角色??焖俑道锶~變換(FFT)[1-2]是離散傅里葉變換的快速算法,它是根據離散傅里葉變換的奇、偶、虛、實(shí)等特性,對離散傅里葉變換的算法進(jìn)行改進(jìn)獲得的,兩者都是為了將信號變換到頻域并進(jìn)行相應的頻譜分析。對于實(shí)時(shí)性要求很強的信號處理來(lái)說(shuō),運算速度對整個(gè)處理的影響是顯而易見(jiàn)的。因為FFT擁有很高的運算能力,使其在無(wú)線(xiàn)通信和數字通信、高速圖像處理、匹配濾波等領(lǐng)域得到極為廣泛的應用。
LTE作為準4 G技術(shù),以正交頻分復用OFDM和多輸入多輸出MIMO技術(shù)為基礎,下行采用正交頻分多址(OFDM)技術(shù),上行采用單載波頻分多址(SC-FDMA)技術(shù),在20 MHz頻譜帶寬下能夠提供下行100 Mb/s和上行50 Mb/s的峰值速率[3]。
頻域分析比時(shí)域分析更優(yōu)越,不僅簡(jiǎn)單,且易于分析復雜信號[4]。在LTE系統中,FFT算法主要應用于基帶信號生成、信號的接收和檢測等,將時(shí)域信號轉移到頻域進(jìn)行處理。
其中,x(n)為復數序列,WNkn和X(K)也為復數,因此每計算一個(gè)X(K)值,需要進(jìn)行N次復數乘法運算和N-1次復數加法運算。而X(K)共有N個(gè)點(diǎn),所以完成整個(gè)DFT運算需要進(jìn)行N2次復數乘法和N(N-1)次復數加法運算,當N很大時(shí),運算量相當可觀(guān)。然而對于實(shí)時(shí)性很強的信號處理來(lái)說(shuō),如滿(mǎn)足其要求,運算速度就太高了。利用旋轉因子WNkn的對稱(chēng)性、周期性和可約性,可以使DFT運算中的有些項合并,將長(cháng)序列的DFT分解為幾個(gè)短序列的DFT,從而大大減少運算次數。FFT算法可以分為時(shí)間抽取法和頻域抽取法兩大類(lèi)。頻域抽取法的運算特點(diǎn)與時(shí)間抽取法的基本相同,不同之處是頻域抽取法的蝶形運算是先加后乘,時(shí)間抽取法的蝶形運算是先乘后加;頻域抽取的輸入序列是自然順序,輸出序列是倒序,而時(shí)間抽取法的輸入序列是倒序,輸出序列是自然順序。
假設輸入序列x(n)長(cháng)度為N=2M,M是正整數。如果不滿(mǎn)足這個(gè)條件,在序列尾部人為地加上若干零值點(diǎn),使其達到這一要求。將序列x(n)按n的奇偶分解為兩個(gè)N/2點(diǎn)的子序列:
2 FFT算法的DSP實(shí)現
2.1 硬件
TMS320C6000系列DSP是TI公司推向市場(chǎng)的高性能DSP,綜合了目前性?xún)r(jià)比高、功耗低等優(yōu)點(diǎn)。TMS320C64系列提高了時(shí)鐘頻率,在體系結構上采用了VelociTI甚長(cháng)指令集VLIW(Very Long Instruction Word)結構[5],芯片內有8個(gè)獨立功能單元的內核,每個(gè)周期可以并行執行8條32 bit指令,最大峰值速度為4 800 MIPS,2組共64個(gè)32 bit通用寄存器,32 bit尋址范圍,支持8/16/32/40 bit的數據訪(fǎng)問(wèn),芯片內集成大容量SRAM,最大可達8 Mb。由于出色的運算能力、高效的指令集、大范圍的尋址能力,使其特別適用于無(wú)線(xiàn)基站、測試儀表等對運算能力和存儲量要求高的應用場(chǎng)合。
2.2 FFT算法的DSP實(shí)現
FFT算法作為一個(gè)子函數模塊且輸入序列長(cháng)度不盡相同,所以,方案定義了輸入輸出變量及其調用格式。調用格式:Turbo_Code(int*,int,int,char*,char*,int*),其中,int分別表示輸入序列的長(cháng)度和FFT的級數;int*分別表示輸入序列的首地址和輸出序列的首地址;char*分別表示旋轉因子的余弦的首地址和旋轉因子的正弦的首地址。
FFT算法具體實(shí)現流程如下:
(1)時(shí)間抽取法的FFT中,每個(gè)蝶形的輸入、輸出數據節點(diǎn)在一條水平線(xiàn)上,所以每個(gè)蝶形的輸出數據可以立即存入原輸入數據所占用的存儲單元。這種原位計算可節省大量的內存,并且理論上減少不同寄存器之間存取數據的時(shí)間。
評論