高效的C編程之: 浮點(diǎn)運算
14.10浮點(diǎn)運算
大多數的ARM處理器硬件上并不支持浮點(diǎn)運算。但ARM上提供了以下幾個(gè)選項來(lái)實(shí)現浮點(diǎn)運算。
本文引用地址:http://dyxdggzs.com/article/257015.htm·浮點(diǎn)累加協(xié)處理器FPA(Floating-PointAccelerator):ARM上提供了一組協(xié)處理器指令專(zhuān)門(mén)實(shí)現浮點(diǎn)運算。但這需要硬件支持,具體某一處理器上是否有FPA協(xié)處理器支持,可以查看ARM相關(guān)手冊。
·浮點(diǎn)運算仿真(FPE):使用軟件仿真了FPA協(xié)處理器的執行。
·浮點(diǎn)運算庫(FPLib):使用ARM的浮點(diǎn)運算庫函數實(shí)現程序中的浮點(diǎn)運算操作。這就意味著(zhù)C編譯器要把每一個(gè)浮點(diǎn)操作轉換成一個(gè)子程序調用。C庫中的子函數使用整型運算來(lái)模擬浮點(diǎn)操作。這些代碼是用高效的匯編語(yǔ)言編寫(xiě)而成的。盡管如此,浮點(diǎn)運算執行起來(lái)還是要比相應整型運算慢得多。
注意 | Thumb指令不支持協(xié)處理器指令,所以在Thumb狀態(tài)下實(shí)現浮點(diǎn)運算,只能調用ARM浮點(diǎn)運算庫。 |
為了在A(yíng)RM上高效地實(shí)現浮點(diǎn)運算,請遵循以下規則。
·避免使用浮點(diǎn)除法運算。通常情況下,除法運算的執行速度是普通加法或乘法運算速度的1/2。在無(wú)法避免除法的情況下,盡量使除法的除數為常數。如,x=x/3.0,可將其變?yōu)閤=x*(1.0/3.0)。這樣除數為常數(1.0/3.0),該值在編譯階段由編譯器計算。
·使用float型代替double型。float型要比double使用更少的內存和寄存器。
·避免使用三角函數功能。實(shí)現三角函數功能,如sin、cos,使用了大量的乘加運算,它的運算速度大約是普通乘法運算的十倍。
·當編譯器處理浮點(diǎn)運算操作時(shí),由于精度的影響很多優(yōu)化不能實(shí)現。比如,表達式3*(x/3),編譯器不能判斷其值和x是等價(jià)的。所以在使用浮點(diǎn)運算表達式時(shí),最好先人工的做一些必要的優(yōu)化。
評論