Linux下Cold Fire 片內SRAM的應用程序優(yōu)化設計
3.3 配置實(shí)時(shí)數據和函數到片內SRAM中執行
把用戶(hù)空間的實(shí)時(shí)數據和函數放置到片內SRAM中執行,由于處理器可以直接從片內SRAM中存取數據和指令,減少了處理器存取數據和指令的周期,提高了程序的執行效率。首先,放置實(shí)時(shí)數據到處理器片內SRAM中。通過(guò)S_malloc和S_free函數來(lái)實(shí)現:S_malloc用來(lái)申請處理器內存空間,S_free用來(lái)對這一申請的空間進(jìn)行釋放。為了靈活使用定義的S_malloc和S_free函數,需要定義一個(gè)結構體和地址指針:
然后,通過(guò)動(dòng)態(tài)內存分配方式可以把MP3解碼程序中的實(shí)時(shí)數據放入處理器內存中執行。加載函數到SRAM中與加載實(shí)時(shí)數據不同,需要通過(guò)指針和枚舉變量來(lái)實(shí)現。首先通過(guò)一個(gè)宏定義設置每個(gè)函數大小為4 KB,并使用枚舉變量為函數分配處理器片內SRAM執行的起始地址。
SRAMFUNC2=SRAM_BIG_FUNC1+BIG_FUNC_SIZE,…};
在定義完函數運行時(shí)加載的存儲地址之后,把MP3解碼程序中的MPEGSUB_synthesis和imdct_1等函數通過(guò)字符串拷貝的方式復制到處理器片內SRAM中執行,經(jīng)過(guò)編譯、鏈接這些函數在執行時(shí)將會(huì )加載到相應的SRAM單元塊中。這樣就減少了處理器執行解碼函數所需的時(shí)間,提高了程序的執行效率。
4 性能測試與分析
為了驗證基于處理器片內SRAM的優(yōu)化設計方案,我們在MCF5329EVB開(kāi)發(fā)板上對經(jīng)該方案優(yōu)化過(guò)的MP3解碼器進(jìn)行了驗證和測試。
首先,進(jìn)行功能測試,應用MPEG組織推薦的測試碼流(128 kb/s,44.1 kHz)。選用一段音頻test.mp3,分別用標準浮點(diǎn)解碼器和本文設計的音頻解碼器進(jìn)行本地解碼測試,并對其解碼波形進(jìn)行比較分析。從圖4的波形比較可以看到,經(jīng)過(guò)本方案優(yōu)化設計的解碼器解碼波形與標準浮點(diǎn)解碼器基本無(wú)差別。經(jīng)人耳測試,無(wú)法辨別出兩者解碼輸出的差別。所以,從功能上講本文設計的基于片內SRAM的應用程序優(yōu)化方案是可行的。
其次,進(jìn)行性能測試。在測試平臺上分別對優(yōu)化前后解碼器的MIPS消耗數和空間消耗量進(jìn)行比較分析,如表2所列。
優(yōu)化前,解碼器MIPS消耗數為68 MIPS@240MHz;優(yōu)化后,解碼器MIPS消耗數為39.2 MIPS@240 MHz。在硬件條件允許的情況下,消耗的內存雖然有一定的增加,但是經(jīng)過(guò)本文方案優(yōu)化后,解碼效率得到了很大的提高。
結 語(yǔ)
本文提出了在嵌入式Linux操作系統下基于處理器片內SRAM的應用程序優(yōu)化設計方案。以MP3解碼器為例,通過(guò)從配置音頻驅動(dòng)程序、實(shí)時(shí)數據和函數到處理器片內SRAM中執行來(lái)對解碼器進(jìn)行優(yōu)化設計,并在ColdFire5329開(kāi)發(fā)平臺上成功實(shí)現該方案。優(yōu)化后的MP3播放器不僅解碼效率高,而且音質(zhì)好,完全可以在中低端處理器上實(shí)現實(shí)時(shí)播放,使低性能CPU處理復雜應用程序成為可能。該方案有效地提高了應用程序的執行效率,降低了功耗,對嵌入式Linux應用產(chǎn)品開(kāi)發(fā)有著(zhù)重要參考價(jià)值。
評論