<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 設計應用 > 高效率嵌入式程序開(kāi)發(fā)

高效率嵌入式程序開(kāi)發(fā)

——
作者:東南大學(xué)國家專(zhuān)用集成電路系統工程技術(shù)研究中心 楊軍 周凡 時(shí)間:2006-12-27 來(lái)源:電子設計應用 收藏

摘  要對應用軟件的質(zhì)量要求很高,在嵌入式開(kāi)發(fā)中須注意對代碼進(jìn)行優(yōu)化,盡可能地提高代碼效率。雖然C編譯器都提供了一定程度的代碼優(yōu)化,但大部分由編譯器執行的優(yōu)化技術(shù)僅涉及執行速度和代碼大小的平衡,不可能使程序既快又小,因而必須在編寫(xiě)程序時(shí)采取必要的措施。本文針對高效率嵌入式程序開(kāi)發(fā)提供了一些編程技巧,對實(shí)際系統開(kāi)發(fā)具有重要作用。

關(guān)鍵詞:編譯器; 程序開(kāi)發(fā); 代碼優(yōu)化

引言

在多媒體、通信等計算復雜度高的應用中,為了滿(mǎn)足制造費用、功耗、性能以及實(shí)時(shí)性等諸多限制條件的要求,程序往往需要特殊設計。這使得設計師在設計面向特定應用的嵌入式軟件時(shí),需要有一套切實(shí)可行的編程準則。而在實(shí)際程序設計中,工程師尤其需要考慮對變量的使用和循環(huán)程序的處理。

變量使用

在進(jìn)行實(shí)際程序開(kāi)發(fā)時(shí),變量的使用至關(guān)重要,其中使用全局變量比向函數傳遞參數更加有效,這樣免去了函數調用時(shí)參數入棧和出棧的需要。當然,使用全局變量會(huì )對程序有一些副作用。變量定義的次序會(huì )導致最終映像中數據布局的不同,如圖1所示。



圖1 變量映像次序混亂狀況

由此可見(jiàn),在聲明變量時(shí),需要考慮怎樣最佳地控制存儲器布局。最好的方法是在編程的時(shí)候,把所有相同類(lèi)型的變量放在一起定義。

通常,工程師設法使用short或char來(lái)定義變量以節省存儲器空間。在函數的局部變量數目有限的情況下,編譯器會(huì )把局部變量分配給內部寄存器,每個(gè)變量占用一個(gè)寄存器。在這種情況下,使用short和char型變量不但不會(huì )節省空間,反而會(huì )帶來(lái)其它的副作用。如圖2所示:假定a是任意可能的寄存器,存儲函數的局部變量。同樣完成加1的操作,32位的int型變量最快,只用一條加法指令。

而8位和16位變量,完成加法操作后,還需要在32位的寄存器中進(jìn)行符號擴展。其中,帶符號的變量,要用邏輯左移和算術(shù)右移兩條指令才能完成符號擴展;無(wú)符號的變量,要使用一條邏輯與指令對符號位進(jìn)行清零。所以,使用32位的int或unsigned int局部變量最有效。某些情況下,函數從外部存儲器讀入局部變量進(jìn)行計算,這時(shí)候,需要把不是32位的變量轉換成32位。至于把8位或16位變量擴展成32位后,隱藏了原來(lái)可能溢出異常這個(gè)問(wèn)題,需要進(jìn)一步仔細考慮。


圖2 不同類(lèi)型局部變量的加法程序

在程序中,經(jīng)常會(huì )使用switch case語(yǔ)句,每一個(gè)由機器語(yǔ)言實(shí)現的測試和跳轉僅僅是為了決定下一步要做什么,就浪費了處理器時(shí)間。為了提高速度,可以把具體的情況按照它們發(fā)生的相對頻率排序。即把最可能發(fā)生的情況放在第一,發(fā)生概率小的情況放在最后,這樣會(huì )減少代碼平均執行時(shí)間。

通常,工程師總是竭力避免使用冗余變量,以精簡(jiǎn)程序。一般情況下這樣做是正確的,但是也有例外,如下所示:
int f(void);
int g(void);             
 file://f()和g()不訪(fǎng)問(wèn)全局變量errs
int errs;            file://全局變量
void test1(void)
{ errs += f();
                errs += g();
}
void test2(void)
{ int localerrs = errs;  
// 定義冗余的局部變量
     localerrs += f();
     localerrs += g();
     errs = localerrs;
}

在第一種情況test1()里,每次訪(fǎng)問(wèn)全局變量errs時(shí)都要先從相應的存儲器下載到寄存器里,經(jīng)f()或g()函數調用后再存儲回原來(lái)的存儲器里面。在該例子中,一共要進(jìn)行兩次這樣的下載/存儲操作。而在第二種情況test2()里,局部變量localerrs被分配以寄存器,這樣一來(lái),整個(gè)函數就只需要一次下載/存儲全局變量存儲器了。盡量節省存儲器訪(fǎng)問(wèn)的次數,對于提高系統性能非常有用。

循環(huán)程序的處理

計數循環(huán)是程序中常用的流程控制結構。在C中,類(lèi)似下面的for循環(huán)比比皆是:
for(loop=1;loop<=limit;loop++)
這種累加計數的方法符合一般的自然思維習慣,所以比下面的遞減計數方法使用更多:
for(loop<=limit;loop!=0; loop--)
這兩者在邏輯上并沒(méi)有效率差異,但是映射到具體的體系結構中,就產(chǎn)生了很大的不同。

累加法比遞減法多用了一條指令,當循環(huán)次數比較多的時(shí)候,這兩段代碼就會(huì )在性能上產(chǎn)生明顯的差異。分析其本質(zhì)原因,在于當進(jìn)行一個(gè)非零常數比較時(shí),必須用專(zhuān)門(mén)的CMP指令來(lái)執行;而當一個(gè)變量與零進(jìn)行比較時(shí),ARM指令可以直接利用條件執行的特性(NE)來(lái)進(jìn)行判斷。很多時(shí)候循環(huán)展開(kāi)由編譯器自動(dòng)完成,不過(guò)應注意對中間變量或結果被更改的循環(huán),編譯程序往往拒絕展開(kāi),這時(shí)候就需要工程師自己來(lái)做展開(kāi)工作了。

尤其值得注意的是,在有內部指令cache的CPU上(如ARM946ES芯片),因為循環(huán)展開(kāi)的代碼很大,往往會(huì )出現高速緩沖存儲器溢出。這時(shí)展開(kāi)的代碼會(huì )頻繁地在CPU的高速緩沖存儲器和內存之間來(lái)回調用,又因為高速緩沖存儲器速度很高,所以此時(shí)循環(huán)展開(kāi)反而會(huì )變慢。同時(shí),循環(huán)展開(kāi)會(huì )影響矢量運算優(yōu)化。

ARM處理器核對NZ(零比較轉移)有特別的指令處理,速度非???,如果你的循環(huán)對方向不敏感,可以由大向小循環(huán)。需要注意的是,如果指針操作使用了i值,這種方法可能引起指針索引超界的嚴重錯誤(i = MAX+1)。當然你可以通過(guò)對i做加減運算來(lái)糾正,但是如果這樣就沒(méi)有提高效率的作用了。

結語(yǔ)

本文對高效率嵌入式ARM程序開(kāi)發(fā)總結了一些編程技巧。在實(shí)際的開(kāi)發(fā)中,可以大大的提高系統的性能,特別是在多媒體和通信等復雜度高的應用中,對程序設計具有指導意義?!?/P>

參考文獻

1 Marshall P. Cline and Greg A. Lomow. C++ FAQs, Addison-Wesley, 1995
2 Bruce Eckel. Thinking in C++(C++ 編程思想,劉宗田 等譯),機械工業(yè)出版社,2000



關(guān)鍵詞: 單片機 嵌入式系統

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>