SAM4E單片機之旅——24、使用DSP庫求向量數量積
DSP(Digital Signal Processing,數字信號處理)中會(huì )使用大量的數學(xué)運算。Cortex-M4中,配置了一些強大的部件,以提高DSP能力。同時(shí)CMSIS提供了一個(gè)DSP庫,提供了許多數學(xué)函數的高效實(shí)現。
本文引用地址:http://dyxdggzs.com/article/201705/358888.htm這次就先做一個(gè)簡(jiǎn)單的嘗試,求兩個(gè)向量的數量積。
一、 硬件

MAC單元
MAC(Multiply-ACcumulate,乘積累加),是DSP中常用的一種運算。Cortex-M4配置了一個(gè)32位的MAC單元,它能在1個(gè)周期里實(shí)現最高難度為32位乘32位再加64位的運算,或是兩個(gè)16位乘16位的運算。Cortex-M4支持的MAC指令如下,這些指令都能在1個(gè)周期內完成:

SIMD
SIMD(Single Instruction Multiple Data,單指令多數據),可以提高DSP時(shí)的計算效率。這在Cortex-M3中不可用的。使用Cortex-M4的SIMD指令,可以在一個(gè)周期內并行地完成4個(gè)8位數的加減,或是2個(gè)16位數的加減。
FPU
FPU是Cortex-M4增加的可選的部件(SAM4E配備了FPU)。其實(shí)現了單精度的浮點(diǎn)數運算,包括一些MAC運算:

二、 使用CMSIS的DSP庫
CMSIS中,提供了一個(gè)DSP庫。這里對DSP中常用的數學(xué)運算做了很高效的實(shí)現。而對于Cortex-M4,其實(shí)現也針對SIMD進(jìn)行了優(yōu)化。
在CMSISInclude文件夾中,頭文件arm_math.h 聲明了這些函數。而在CMSISLibGCC 中,有針對各平臺編譯好了的靜態(tài)庫文件。在CMSISDSP_LibSource 中,有DSP的實(shí)現源碼。
而在使用arm_math.h 文件的過(guò)程中,需要根據目標平臺預定義宏ARM_MATH_CM4,ARM_MATH_CM3 或ARM_MATH_CM0 。而若需要使用FPU,則需要在設備頭文件(如sam4e16e.h)中將宏__FPU_PRESENT 的值定義為1。
在A(yíng)S6中,默認已經(jīng)添加了DSP的支持。
進(jìn)入工程屬性的toolchain選項卡,可以在A(yíng)RM/GNU C Complier的Directories中選擇編譯時(shí)搜索頭文件的路徑。AS6在建立工程時(shí),就會(huì )一些需要的頭文件拷貝到工程目錄下,同時(shí)做好了路徑設置。比如AS6已經(jīng)把arm_math.h 拷貝到下圖中方框指出的路徑了:

在A(yíng)RM/GNU Linker的Libraries選項中,可以選擇鏈接時(shí)使用的庫以及庫的路徑。同樣,AS6已經(jīng)把靜態(tài)庫文件拷貝到了工程目錄下,且設置好了文件:

在A(yíng)RM/GNU C Complier的Symbols選項中,可以設置預定義的宏??梢栽谶@里聲明說(shuō)明DSP的目標平臺的宏ARM_MATH_CM4:

在設備頭文件件中聲明__FPU_PRESENT 的值。如果有FPU,則將該宏定義為1,否則定義為0。CMSIS已經(jīng)做好了定義:
//File: …srcASFsamutilscmsissam4eincludesam4e16e.h
//Line: 266
/**< SAM4E16E does provide a FPU */
#define __FPU_PRESENT 1
另外,如果不使用AS6提供的startup文件,或者需要在自己的代碼中使用FPU的話(huà),還需要做額外的設置。相關(guān)內容在FPU的示例中做了說(shuō)明。
三、 簡(jiǎn)單示例
DSP庫里有計算向量數量積的函數。DSP庫的函數支持多種類(lèi)型的定點(diǎn)數,且對于配備了FPU的部件,也支持浮點(diǎn)數。所以只需要簡(jiǎn)單地調用下所需函數即可:
// 向量為(0.0, 1.1, 2.2, ..., 16.5)
const int VEC_SIZE = 16;
float32_t vec[VEC_SIZE];
for (int i = 0; i < VEC_SIZE; ++i)
vec[i] = 1.1f * i;
// 計算向量與自身的數量積
float32_t result = 0;
arm_dot_prod_f32(vec, vec, VEC_SIZE, &result);
// result == 1500.4
查看arm_dot_prod_f32() 的實(shí)現,發(fā)現其已經(jīng)為了效率進(jìn)行了循環(huán)展開(kāi)。而查看另外一些有關(guān)定點(diǎn)數的運算,可以發(fā)現其實(shí)現已經(jīng)使用了SIMD等特殊指令;有些甚至針對內存訪(fǎng)問(wèn)的延遲進(jìn)行了優(yōu)化。不難看出,這個(gè)庫的實(shí)現進(jìn)行了細致優(yōu)化的。
另外,除了基本的數學(xué)函數,DSP庫也實(shí)現了快速數學(xué)函數(三角函數、開(kāi)平方等)、實(shí)數相關(guān)、矩陣運算、統計、濾波、變換(FFT等)、馬達控制等功能。arm_math.h 中,已經(jīng)對各個(gè)函數的功能、參數意義等做了詳細的說(shuō)明。
評論