微控制器的開(kāi)發(fā)方案
微控制器開(kāi)發(fā)團隊與編譯器開(kāi)發(fā)人員的合作成果是生成的代碼效率更高,性能更好。本文介紹的是為了使ATMEL AVR微控制器系列更適合C編譯器,開(kāi)發(fā)者在編譯器開(kāi)發(fā)階段對微控制器架構和指令集所進(jìn)行的調整。
本文引用地址:http://dyxdggzs.com/article/173343.htmAVR架構的核心是一個(gè)可快速訪(fǎng)問(wèn)RISC寄存器文件。該文件由32個(gè)8位通用寄存器構成。微控制器可在一個(gè)單時(shí)鐘周期內加載該文件中的任意兩個(gè)寄存器到算術(shù)邏輯單元(Arithmetic Logical Unit, ALU),完成所要求的操作,將結果寫(xiě)回到任意一個(gè)寄存器。ALU支持寄存器間或某一寄存器與一個(gè)常數之間的運算和邏輯功能,單寄存器操作也是在A(yíng)LU中執行的。微控制器使用一個(gè)哈佛(Harvard)架構,在該架構中,程序存儲器空間與數據存儲器空間是相互隔離的。程序存儲器采用單級管道訪(fǎng)問(wèn)技術(shù),當一條指令被執行的同時(shí),下一條指令已從程序存儲器中被預先提取。由于其算術(shù)和邏輯操作都真正地在單周期內完成,因此AVR微控制器的性能達到每MHz一個(gè)MIPS。
圖1 AVR 架構
細調微控制器
采用高級語(yǔ)言(High Level Languange, HLL)代替匯編語(yǔ)言來(lái)開(kāi)發(fā)微控制器應用程序有許多優(yōu)勢,但一直都有一個(gè)重大缺點(diǎn),即代碼量不斷增加。我們在開(kāi)發(fā)AVR微控制器時(shí)考慮了使用C語(yǔ)言來(lái)開(kāi)發(fā)應用,使得我們有可能為器件構建出一個(gè)高效C編譯器。為了進(jìn)一步提升這項特性,我們在A(yíng)VR的架構和指令集未完成前就開(kāi)始著(zhù)手C編譯器的開(kāi)發(fā)。我們先讓瑞典 IAR Systems的編譯器專(zhuān)業(yè)開(kāi)發(fā)人員對我們的AVR架構和指令集進(jìn)行評測,最后開(kāi)發(fā)出非常適合運行C編譯器生成代碼的微控制器。
尋址模式
為讓編譯器生成高效的代碼,重要的是讓尋址模式匹配C語(yǔ)言的需要。AVR架構原來(lái)配了兩個(gè)指針寄存器(Pointer Register)。這兩個(gè)指針可用于間接尋址、算后增量(post increment)間接尋址、算前減量(pre-decrement)間接尋址,以及帶位移(displacement)的間接尋址,能夠很好地支持指針操作。此外,還有一個(gè)用于訪(fǎng)問(wèn)數據存儲器中變量的頁(yè)面直接尋址模式。
指針位移
帶位移的間接尋址是一種非常有用的尋址模式,即使從C編譯器的角度亦如此。例如,將指針指向某一結構(struct)的第一個(gè)成員,就可以訪(fǎng)問(wèn)該結構內位移量所允許的其他任何位置,無(wú)須變更16位指針。帶位移的間接尋址模式也常常用于訪(fǎng)問(wèn)軟件堆棧上的變量。函數參數和autos常常放在軟件堆棧上,這樣,不用變更指針就可進(jìn)行讀寫(xiě)操作。位移尋址在定位數組成員(addressing elements in an array)時(shí)也非常有用。
盡管位移模式在許多情況下非常有用,但仍存在一個(gè)位移受限的問(wèn)題。位移原本被限制在16個(gè)位置以?xún)?,而?shí)際應用往往超出該數量。這樣,在位移模式無(wú)法訪(fǎng)問(wèn)的位置,就必須加載一個(gè)新的指針。為擴展位移模式的訪(fǎng)問(wèn)范圍,我們不得不改變指令集的其他部分,以獲得足夠的編碼空間。同時(shí),我們還得知,C編譯器很難使用頁(yè)面直接尋址模式。于是,取消了頁(yè)面直接尋址模式,使用騰出的空間將位移模式擴展為64個(gè)位置,足以滿(mǎn)足大多數間接尋址的要求。原來(lái)的頁(yè)面直接尋址模式變成一個(gè)兩個(gè)字長(cháng)的非頁(yè)面直接尋址模式。
存儲器指針數
AVR微控制器原來(lái)配置了兩個(gè)16位存儲器指針。如要采用C編譯器,那么其中一個(gè)指針必須專(zhuān)門(mén)用作軟件堆棧,這樣,就只剩一個(gè)存儲器指針。在許多情況下,需要將存儲器從一個(gè)區域復制到另一個(gè)區域。但由于只有一個(gè)指針,需要讀1字節,設置指針,確定寫(xiě)入目標位置,寫(xiě)入這字節,然后再將指針設回數據源位置。如果增加第三個(gè)存儲器指針(精簡(jiǎn)功能),完成存儲器區域復制就不需要設置指針。如下例所示,只要使用算后增量間接尋址模式就可構建非常高效的存儲器讀寫(xiě)循環(huán)(假設:將指針Z指向源的第一字節,X指向目標的第一字節):
LDI R16,0x60 ;Load byte count
loop: LD R17,Z+ ;Load byte,
increment pointer
ST X+,R17 ;Store
byte, increment pointer
SUBI R16,1;Decrement
counter
BRNE loop; Branch
if more bytes
具備指針算后增量(post increment)、算前減量(pre-decrement) (+1、-1)操作的可能性對于實(shí)現堆棧也非常有效。這當然也可用于軟件運行時(shí)間堆棧。
直接尋址
如在指針位移一節所述, AVR原來(lái)有一個(gè)頁(yè)面直接尋址模式,但是,對于編譯器該模式難于使用,且效率較低。由于我們需要更多的編碼空間來(lái)增加位移量,因此取消了頁(yè)面直接尋址模式。不過(guò),如果完全沒(méi)有直接尋址模式,代碼效率也會(huì )降低,因為在有些情況下需要訪(fǎng)問(wèn)存放在數據存儲器中的變量。尤其是處理靜態(tài)字符時(shí),代碼開(kāi)銷(xiāo)將會(huì )很大(達到50%),因為靜態(tài)變量必須保存在數據存儲器中,不能自動(dòng)放置到寄存器中。為了克服代碼效率低下的問(wèn)題,我們占用一個(gè)16位地址來(lái)增加一些非頁(yè)面直接尋址指令。這樣,就可用一條指令來(lái)完成64KB數據空間的尋址。要訪(fǎng)問(wèn)如此大的一個(gè)存儲器區域,訪(fǎng)問(wèn)指令必須是兩個(gè)16位字。
如果訪(fǎng)問(wèn)的字節數少(例如讀取一個(gè)字符),使用這種尋址方式的效率高于指針?lè )绞?。對于較大的區域,可能仍然是使用間接尋址比較有效(參見(jiàn)下面的示例)。
Loading of a character:
Indirect addressing (6 Bytes): Direct addressing (4 Bytes):
LDI R30,LOW(CHARVAR) LDS R16,CHARVAR
LDI R31,HIGH(CHARVAR)
LD R16, Z
Loading of a long integer:
Indirect addressing (12 Bytes) Direct addressing (16 Bytes)
LDI R30,LOW(LONGVAR) LDS R0,LONGVAR
LDI R31,HIGH(LONGVAR) LDS R1,LONGVAR+1
LDD R0,Z LDS R2,LONGVAR+2
LDD R1,Z+1 LDS R3,LONGVAR+3
LDD R2,Z+2
LDD R3,Z+3
零標志傳播
為實(shí)現條件轉移,需要使用一些指令來(lái)操作由一些標志(flag)構成的AVR狀態(tài)寄存器。跟在這類(lèi)指令之后的條件轉移指令(conditional branch instruction)是否執行轉移,取決于這些標志的設置。使用運算指令操作這些標志,就可檢查一個(gè)數A與另一個(gè)數B之間的大小關(guān)系。當被檢查的數為8位的數時(shí),不存在什么問(wèn)題,因為所有標志都依賴(lài)一條指令設置的標志值。當被檢查的數為16位或32位的數時(shí)(這在C語(yǔ)言中是常有的情況),問(wèn)題就有點(diǎn)棘手了,例如一個(gè)32位減法操作就相當于要連續進(jìn)行4個(gè)8位減法操作,而每做一次8位減法,就會(huì )產(chǎn)生一組新的標志。
為傳播進(jìn)位標志,大多數處理器都包含一些能處理進(jìn)位標志先前設置值的指令。例如,帶進(jìn)位的減法(SBC)指令;執行SBC A,B語(yǔ)句就相當于將A變成進(jìn)位位。但要正確完成所有的條件轉移操作,這里還有另一個(gè)標志需要傳播,即零標志。
示例:
A=R3:R2:R1:R0,
B=R7:R6:R5:R4
我們打算從A中減去B,并如果A=B就跳轉到一個(gè)指定位置。如果這個(gè)零標志只依賴(lài)于最后的運算指令,那么下面的指令將不會(huì )執行:
SUB R0,R4
SBC R1,R5
SBC R2,R6
SBC R3,R7 ; R3=R7
=> Zero flag set
BREQ destination
這是因為BREQ指令使用的標志值只取決于最后的SBC指令設置的標志值。如果大多數高位直接相等,即便32位數不相等,零標志也將被置位,而轉移也會(huì )被執行。這種問(wèn)題也會(huì )出現在其他的條件轉移上。
有兩種辦法可以解決這個(gè)問(wèn)題。一是保存每個(gè)指令產(chǎn)生的標志,然后在第四個(gè)減法完成后檢查所有的零標志。另一個(gè)更精細的方法是在進(jìn)位指令中傳播零標志(參見(jiàn)下面方式):
Znew =Not(R7) AND
Not(R6) AND
...
Not(R0) AND
Zold
使用這種方式傳播零標志,所有條件轉移在最后一個(gè)減法操作完成后都會(huì )被執行,因為參與標志(溢出和正數標志)所剩部分只取決于最高位字節。
評論