<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 嵌入式系統 > 設計應用 > STM32F4之FPU性能的充分發(fā)揮-設置要點(diǎn)

STM32F4之FPU性能的充分發(fā)揮-設置要點(diǎn)

作者：時(shí)間：2016-11-11 來(lái)源：網(wǎng)絡(luò )

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

這個(gè)我知道，這是ST的庫的問(wèn)題，在systeminit的函數里，加上以下這一句就行了，就是打開(kāi)fpu的意思，沒(méi)有這一句，選了keil的選項也沒(méi)用的，另外你試試keil的軟仿貌似也是不行的，從0x00000無(wú)法跳轉，總之太新了，bug太多。
void SystemInit(void)
{

本文引用地址：http://dyxdggzs.com/article/201611/316926.htm

#if (__FPU_PRESENT == 1) && (__FPU_USED == 1)
SCB->CPACR |= ((3UL << 10*2)|(3UL << 11*2));/* set CP10 and CP11 Full Access */
#endif

STM32F4之FPU性能的充分發(fā)揮-設置要點(diǎn)

浮點(diǎn)運算一直是定點(diǎn)CPU的難題，比如一個(gè)簡(jiǎn)單的1.1+1.1，定點(diǎn)CPU必須要按照IEEE-754標準的算法來(lái)完成運算，對于8位單片機來(lái)說(shuō)已經(jīng)完全是噩夢(mèng)，對32為單片機來(lái)說(shuō)也不會(huì )有多大改善。雖然將浮點(diǎn)數進(jìn)行Q化處理能充分發(fā)揮32位單片機的運算性能，但是精度受到限制而不會(huì )太高。對于有FPU（浮點(diǎn)運算單元）的單片機或者CPU來(lái)說(shuō)，浮點(diǎn)加法只是幾條指令的事情。

現在又FPU或者硬件浮點(diǎn)運算能力的主要有高端DSP（比如TI F28335/C6000/DM6XX/OMAP等)，通用CPU（X87數學(xué)協(xié)處理器）和高級的ARM+DSP處理器等。

STM32-F4屬于Cortex-M4F構架，這和M0、M3的最大不同就是多了一個(gè)F-float，即支持浮點(diǎn)指令集，因此在處理數學(xué)運算時(shí)能比M0/M3高出數十倍甚至上百倍的性能，但是要充分發(fā)揮FPU的數學(xué)性能，還需要一些小小的設置：

1.編譯控制選項：雖然STM32F4XX固件庫的例程之system_stm32f4XXX.c文件中添加了對應的代碼，但給用戶(hù)評估使用的STM32F4-Discovery例程中卻沒(méi)有，因此MDK4.23編寫(xiě)浮點(diǎn)運算程序時(shí)，雖然編譯器正確產(chǎn)生了V指令來(lái)進(jìn)行浮點(diǎn)運算，但是因為system_stm32f4XXX.c文件沒(méi)有啟用FPU，因此CPU執行時(shí)只認為是遇到非法指令而跳轉到HardFault_Handler()中斷中原地踏步。因此要保證這個(gè)錯誤不發(fā)生，必須要在system_init()函數里面添加如下代碼：

/* FPU settings ------------------------------------------------------------*/
#if (__FPU_PRESENT == 1) && (__FPU_USED == 1)
SCB->CPACR |= ((3UL << 10*2)|(3UL << 11*2)); /* set CP10 and CP11 Full Access */
#endif

因為這個(gè)選項是有條件編譯控制的，因此需要在工程選項（Project->Options for target "XXXX"）中的C/C++選項卡的Define中加入如下的語(yǔ)句：__FPU_PRESENT=1,__FPU_USED =1。這樣編譯時(shí)就加入了啟動(dòng)FPU的代碼，CPU也就能正確高效的使用FPU進(jìn)行簡(jiǎn)單的加減乘除了。

但這還遠遠不夠。對于復雜運算，比如三角函數，開(kāi)方等運算，如果編程時(shí)還是使用math.h頭文件，那是沒(méi)法提升效率的：因為math.h頭文件是針對所有ARM處理器的，其運算函數都是基于定點(diǎn)CPU和標準算法（IEEE-754），并沒(méi)有預見(jiàn)使用FPU的情況，需要很多指令和復雜的過(guò)程才能完成運算，也就增加了運算時(shí)間。因此要充分發(fā)揮M4F的浮點(diǎn)功能，就需要使用固件庫自帶的arm_math.h，這個(gè)文件根據編譯控制項（__FPU_USED == 1）來(lái)決定是使用那一種函數方法：如果沒(méi)有使用FPU，那就調用keil的標準math.h頭文件中定義的函數；如果使用了FPU，那就是用固件庫自帶的優(yōu)化函數來(lái)解決問(wèn)題。

在arm_math的開(kāi)頭部分是有這些編譯控制信息：

#ifndef _ARM_MATH_H
#define _ARM_MATH_H

#define __CMSIS_GENERIC /* disable NVIC and Systick functions */

#if defined (ARM_MATH_CM4)
#include "core_cm4.h"
#elif defined (ARM_MATH_CM3)
#include "core_cm3.h"
#elif defined (ARM_MATH_CM0)
#include "core_cm0.h"
#else
#include "ARMCM4.h"
#warning "Define either ARM_MATH_CM4 OR ARM_MATH_CM3...By Default building on ARM_MATH_CM4....."
#endif

#undef __CMSIS_GENERIC /* enable NVIC and Systick functions */
#include "string.h"
#include "math.h"

就是說(shuō)如果不使用CMSIS的，就會(huì )調用keil自帶的標準庫函數。否則就用CMSIS的定義。這里因為是用的STM32F4，所以應該要ARM_MATH_CM4控制，即加入core_cm4.h，否則就用使用ARMCM4.h——但在編譯時(shí)keil會(huì )提示找不到這文件。因此需要在工程選項之C/C++選項卡的define中繼續加入語(yǔ)句ARM_MATH_CM4。

加入上述編譯控制項之后，高級數學(xué)函數的使用基本沒(méi)問(wèn)題了，比如正余弦三角函數的計算。但需要注意，如果你直接使用sin()、cos()、sqrt()這樣的函數，那結果還算調用keil的math.h，你可以在debug時(shí)看對應的代碼，其匯編指令為BL.W __hardfp_xxx。因此這時(shí)要完成三角函數的計算就要使用arm_sin_f32()或者arm_cos_f32()，用法不變，這兩個(gè)函數的原型分別在arm_sin_f32.c和arm_cos_f32.c中。通過(guò)對256點(diǎn)三角函數表的查詢(xún)和插值算法得到任意角度的精確函數值，這就比“原裝”的sin()、cos()快多了。

當然有些例外的是開(kāi)發(fā)函數sqrt()，在arm_math.h中是這么定義的：

static __INLINE arm_status arm_sqrt_f32(float32_t in, float32_t *pOut)
{
if(in > 0)
{
// #if __FPU_USED
#if (__FPU_USED == 1) && defined ( __CC_ARM )
*pOut = __sqrtf(in);
#else
*pOut = sqrtf(in);
#endif
return (ARM_MATH_SUCCESS);
}
else
{
*pOut = 0.0f;
return (ARM_MATH_ARGUMENT_ERROR);
}
}

即開(kāi)方用的函數是arm_sqrt_f32()，其中首先判斷被開(kāi)發(fā)的書(shū)是否大于0，只有大于0的才能進(jìn)行運算，否則輸出結果為0并返回“錯誤”標志。如果大于0，并且實(shí)用了FPU和__CC_ARM控制項，那調用__sqrtf()來(lái)完成編譯，否則調用sqrtf()——這個(gè)sqrtf()是能在keil的math.h中找到的，即調用子函數來(lái)完成運算，而__sqrtf()呢？新出現的，相信大家都能猜到是什么玩意兒：對，就是VSQRT指令！因此要把這點(diǎn)性能也要發(fā)揮出來(lái)，就需要工程選項之C/C++選項卡的define中繼續加入語(yǔ)句__CC_ARM才行。大家可以比較一下是否加入__CC_ARM編譯后會(huì )匯編代碼的差別巨大差別。

當然，對于arm_sqrt_f32()函數還是有些麻煩，如果你確認被開(kāi)方的書(shū)是大于等于0的，那就直接使用__sqrtf()函數完成運算，即一條簡(jiǎn)單的VSQRT指令。

STM32F4固件庫還提供了其他很有用的數學(xué)函數，都位于DSP_Lib文件夾，請大家慢慢探索，Discovery！

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： STM32F4FPU性能設置要

評論

相關(guān)推薦

STM32F4之FPU性能的充分發(fā)揮-設置要點(diǎn)

嵌入式系統 STM32F4FPU性能設置要 | 2016-11-11

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>