DSP編程技巧---詳解浮點(diǎn)運算的定點(diǎn)編程
我們使用的處理器一般情況下,要么直接支持硬件的浮點(diǎn)運算,比如某些帶有FPU的器件,要么就只支持定點(diǎn)運算,此時(shí)對浮點(diǎn)數的處理需要通過(guò)編譯器來(lái)完成。在支持硬件浮點(diǎn)處理的器件上,對浮點(diǎn)運算的編程最快捷的方法就是直接使用浮點(diǎn)類(lèi)型,比如單精度的float來(lái)完成。但是在很多情況下,限于成本、物料等因素,可供我們使用的只有一個(gè)定點(diǎn)處理器時(shí),直接使用float類(lèi)型進(jìn)行浮點(diǎn)類(lèi)型的運算會(huì )使得編譯器產(chǎn)生大量的代碼來(lái)完成一段看起來(lái)十分簡(jiǎn)單的浮點(diǎn)數學(xué)運算,造成的后果是程序的執行時(shí)間顯著(zhù)加長(cháng),且其占用的資源量也會(huì )成倍地增加,這就涉及到了如何在定點(diǎn)處理器上對浮點(diǎn)運算進(jìn)行高效處理的問(wèn)題。
本文引用地址:http://dyxdggzs.com/article/201612/332390.htm既然是定點(diǎn)處理器,那么其對定點(diǎn)數,或者說(shuō)字面意義上的“整數”進(jìn)行處理的效率就會(huì )比它處理浮點(diǎn)類(lèi)型的運算要高的多。所以在定點(diǎn)處理器上,我們使用定點(diǎn)的整數來(lái)代表一個(gè)浮點(diǎn)數,并規定整數位數和小數位數,從而方便地對定點(diǎn)數和浮點(diǎn)數進(jìn)行轉換。以一個(gè)32位的定點(diǎn)數為例,假設轉換因子為Q,即32位中小數的位數為Q,整數位數則為31-Q(有符號數的情況),則定點(diǎn)數與浮點(diǎn)數的換算關(guān)系為:
定點(diǎn)數=浮點(diǎn)數×2^Q
例如,浮點(diǎn)數-2.0轉換到Q為30的定點(diǎn)數時(shí),結果為:
定點(diǎn)數=-2×2^30=-2147483648
32位有符號數的表示范圍是:-2147483648到2147483647。如果我們把有符號定點(diǎn)數的最大值2147483647轉換為Q為30對應的浮點(diǎn)數,則結果為:
浮點(diǎn)數2147483647/2^30=1.999999999
從上面的兩個(gè)計算例子中也可以看出,在Q30格式的情況下,最大的浮點(diǎn)數只能表示到1.999999999,如果我們想把浮點(diǎn)數2.0轉換為Q30的定點(diǎn)數,則產(chǎn)生了溢出,即造成了1e-9的截斷誤差。在此我們列出Q0到Q30對應的范圍和分辨率如下表所示:
如果你嫌自己計算麻煩的話(huà),可以借助Matlab的命令來(lái)求取它們的轉換,例如,在Matlab的命令窗口中輸入:
q = quantizer('fixed', 'ceil', 'saturate', [32 30]);
FixedNum=bin2dec(num2bin(q,1.999999999));
回車(chē)之后就可以看到1.999999999轉成Q30之后的定點(diǎn)數了。
弄清楚了單個(gè)浮點(diǎn)數和定點(diǎn)數之間的轉換關(guān)系,接下來(lái)就需要了解一下兩個(gè)定點(diǎn)數所代表的浮點(diǎn)數進(jìn)行運算時(shí),是如何轉換的了。根據乘法的結合律、分配率,浮點(diǎn)數轉換之后的定點(diǎn)數是可以直接運算的,例如:
1. 不同Q格式的轉換
設有定點(diǎn)數Fixed1=Float1*2^Q1,如果把它用為Q2這個(gè)不同精度/表示范圍的定點(diǎn)數來(lái)表示,則有Fixed2=Float1*2^Q2。所以不同的Q格式直接的轉換為:
Fixed2=Fixed1*2^Q2/2^Q1=Fixed1*2^(Q2-Q1)
因為Fixed1、Fixed2都是定點(diǎn)數,所以在C編程的情況下,我們可以使用高效的左移、右移操作來(lái)完成這個(gè)乘以2^(Q2-Q1)的操作。
2. 兩個(gè)相同Q格式的定點(diǎn)數:
Fixed1=Float1*2^Q
Fixed2=Float2*2^Q
則加法操作為:
Float1+Float2=Fixed1/2^Q+Fixed/2^Q=(Fixed1+Fixed2)/2^Q
對于上述的加法操作,如果定點(diǎn)數的和Fixed1+Fixed2超過(guò)了32位整數的極值,則會(huì )發(fā)生溢出現象,造成結果的不正確,此時(shí)我們只能先損失一倍的精度,把Float1、Float2的Q值變?yōu)镼-1.
乘法操作為:
Float1*Float2=Fixed1/2^Q*Fixed/2^Q= Fixed1*Fixed2/2^(2Q)
同樣的道理,如果Fixed1*Fixed2之后的定點(diǎn)數超過(guò)了32位整數的極值,則我們也需要提前對它們進(jìn)行一下折算,變換一下它們的Q值。這就涉及到對結果的一個(gè)預估問(wèn)題,也是定點(diǎn)編程不如浮點(diǎn)編程簡(jiǎn)單、高效的不足之一。
3. 兩個(gè)不同Q格式的定點(diǎn)數:
Fixed1=Float1*2^Q1
Fixed2=Float2*2^Q2
運算的規則是結合了前面的兩種情況,只不過(guò)多了額外的轉換工作:要么把其中的一個(gè)Q1格式的定點(diǎn)數先轉換為另一個(gè)Q2格式,要么把它們都轉換為一個(gè)中間值Q3格式的定點(diǎn)數,然后再進(jìn)行運算。
這些運算雖然并不復雜,但是如果在數學(xué)運算比較多的情況下,一個(gè)個(gè)的進(jìn)行手工轉換還是比較麻煩的,還好在近些年的處理器特別是DSP芯片中,在其BootROM中都內置了強大的數學(xué)表來(lái)幫助我們完成這些轉換工作,我們只要按照一定的格式進(jìn)行書(shū)寫(xiě),那么編譯器就會(huì )自動(dòng)調用相關(guān)的庫函數來(lái)完成了。以TI的C28x系列DSP為例,我們可以使用現成的IQMath庫來(lái)完成這些繁瑣的工作。它的使用方法示例為
1)在工程屬性中引用IQmath.lib庫文件
2)在使用IQMath庫函數的主程序中引用相關(guān)的頭文件:
#include
#define PI 3.14159
_iq input, sin_out;
void main(void )
{
/* 0.25 x PI radians represented in Q29 format*/
input=_IQ29(0.25*PI);
sin_out =_IQ29sin(input);
}
其中,我們可以在頭文件中指定一個(gè)全局的Q格式,在不需要特別指定Q值的時(shí)候,使用默認的值。
例如,在頭文件中#define Q 28,則我們在程序中調用IQMath庫函數時(shí),
sin_out =_IQsin(input);//使用全局定義的Q28格式
sin_out =_IQ29sin(input); //特別指定使用Q29格式
默認情況下,編譯器使用的Q格式是24,如果追求更高的精度,則可以使用更大的Q值,但是相應地表示的浮點(diǎn)數的范圍也要小,此時(shí)可以考慮使用標么值,使得大部分變量的值都處在-1到1的區間內。
此外,在C語(yǔ)言編程時(shí),調用方式是_IQsin(input),在C++編程時(shí),則直接使用IQsin(input)就可以了。
3)在CMD鏈接文件中指明IQMath數學(xué)表的位置:
例如,對于281x器件:
MEMORY
{
PAGE 0:
PRAMH0 (RW) : origin = 0x3f8000, length = 0x001000
PAGE 1:
IQTABLES (R) : origin = 0x3FF000, length = 0x000b50
DRAMH0 (RW) : origin = 0x3f9000, length = 0x001000
}
SECTIONS
{
IQmathTables : load = IQTABLES, type = NOLOAD, PAGE = 1
IQmathTablesRam : load = DRAMH0, PAGE = 1
IQmath : load = PRAMH0, PAGE = 0
}
對于2833x器件:
MEMORY
{
PAGE 0:
PRAML0 (RW) : origin = 0x008000, length = 0x001000
PAGE 1:
IQTABLES (R) : origin = 0x3FE000, length = 0x000b50
IQTABLES2 (R) : origin = 0x3FEB50, length = 0x00008c
DRAML1 (RW) : origin = 0x009000, length = 0x001000
}
SECTIONS
{
IQmathTables : load = IQTABLES, type = NOLOAD, PAGE = 1
IQmathTables2 > IQTABLES2, type = NOLOAD, PAGE = 1
{
IQmath.lib
}
IQmathTablesRam : load = DRAML1, PAGE = 1
IQmath : load = PRAML0, PAGE = 0
}
對于280x器件:
MEMORY
{
PAGE 0:
PRAML0 (RW) : origin = 0x008000, length = 0x001000
PAGE 1:
IQTABLES (R) : origin = 0x3FE000, length = 0x000b50
IQTABLES2 (R) : origin = 0x3FEB50, length = 0x00008c
IQTABLES3 (R) : origin = 0x3FEBDC, length = 0x0000AA
DRAML1 (RW) : origin = 0x009000, length = 0x001000
}
SECTIONS
{
IQmathTables : load = IQTABLES, type = NOLOAD, PAGE = 1
IQmathTables2 > IQTABLES2, type = NOLOAD, PAGE = 1
{
IQmath.lib
}
IQmathTables3 > IQTABLES3, type = NOLOAD, PAGE = 1
{
IQmath.lib
}
IQmath : load = PRAML0, PAGE = 0
}
為了方便數學(xué)運算的高效處理,IQMath庫中還包含了常用的數學(xué)運算函數,包括:
1. 格式轉換
IQN浮點(diǎn)轉定點(diǎn),IQNtoF定點(diǎn)轉浮點(diǎn),atoIQN字符串轉定點(diǎn),IQNtoa定點(diǎn)轉字符串,IQNint返回定點(diǎn)數的整數部分,IQNfrac返回定點(diǎn)數的小數部分,IQtoIQN和IQNtoIQ為指定Q格式與全局Q格式的互轉,IQtoQN和QNtoIQ為32位與16位互轉,IQmpy2, 4, 8..64即左移,IQdiv2, 4, 8..64即右移
2. 算數運算
IQNmpy和IQNrmpy:乘法,IQNrsmpy為帶飽和的乘法。IQNmpyI32和IQNmpyI32int為定點(diǎn)數與32位整數的乘法,IQNmpyI32frac可返回結果的小數位數。QNmpyIQX:不同Q格式的定點(diǎn)數相乘。
IQNdiv:除法運算。
3. 三角運算
包括IQNasin,IQNsin,IQNsinPU,IQNacos,IQNcos,IQNcosPU,IQNatan2,IQNatan2PU,IQNatan。
其中,PU的含義在該函數中π已經(jīng)折算為1。例如:
sin(0.25*π)=sinPU(0.25)。
4. 代數運算
包括IQNexp,IQNlog,IQNsqrt,IQNisqrt,IQNmag,IQNabs,IQsat
評論