ARM體系結構研究(一)
Thumb指令的優(yōu)點(diǎn)在于它可以在保留32位代碼優(yōu)勢的同時(shí),大大節省系統的存儲空間,因為在Thumb指令集中的操作數仍然是32位的,指令地址也是32位的,只是指令編碼變成了16位,而ARM指令則為32位,所以,相比之下,實(shí)現同樣的功能,Thumb指令的條數要比ARM略多。圖2.1是“Add Rd,#Constant”在Thumb狀態(tài)和ARM狀態(tài)下的指令比較:
圖2.1 Thumb指令和ARM指令的比較
由上圖我們可以清楚地看到Thumb指令的精簡(jiǎn)之處,所以Thumb的存儲空間僅僅是ARM存儲空間的60%~70%,但是Thumb的指令條數比ARM指令條數多30%~50%,如果使用32位的存儲器,由于指令條數較少等原因,ARM指令會(huì )比Thumb指令快40%左右,而使用16位存儲器時(shí),Thumb指令則會(huì )快40%~50%。同時(shí)與ARM比較Thumb指令的功耗會(huì )降低約30%。但是Thumb指令也有其局限性。第一、偏移范圍,在Thumb指令中條件轉移偏移只有8位,也就是說(shuō)只能在256Byte的范圍內有條件地轉移,在無(wú)條件轉移中可以有16位的偏移,而這些在A(yíng)RM指令中都是32位,大大提高了靈活性。同時(shí),在Thumb指令中不支持乘法和累加,沒(méi)有協(xié)處理器指令沒(méi)有信號量指令也沒(méi)有CPSR指令。
在面臨二者的取舍的時(shí)候,同其它無(wú)數的案例一樣,發(fā)揮各自的長(cháng)處是最完美的解法。如果系統對性能要求較高,應采用32位的存儲器和ARM指令集,而對功耗和成本要求較高,則應使用Thumb指令集。但是如果兩者結合使用,讓它們充分發(fā)揮各自的優(yōu)點(diǎn),則會(huì )取得更好的效果。
ARM指令的基本格式如下:
其中<>號內的項是必須的,{}號內的項是可選的,opcode為指令助記符;cond是該動(dòng)作的執行條件;S表示影響CPSR寄存器(程序狀態(tài)寄存器)的值,如果不加則表示不影響CPSR的值;Rd表示運算結果的目標寄存器;Rn表示第1個(gè)操作數的寄存器;operand2表示第2個(gè)操作數,可選。 同時(shí),ARM芯片還支持協(xié)處理器,在A(yíng)RM指令集中有對協(xié)處理器的數據操作、數據讀取、數據寫(xiě)入和CPU與協(xié)處理器的寄存器傳送的相應指令。 ARM指令集詳細介紹見(jiàn)附錄A。 2.5 運行Java虛擬機(JVM)解釋Java字節碼這種方式對大多數嵌入式應用來(lái)說(shuō)占用空間過(guò)多,運行速度過(guò)慢。而系統發(fā)展的趨勢及市場(chǎng)的需求決定了Java應用需要有更強的圖形處理能力以及一個(gè)強大的Java虛擬機。于是催生出了Jazelle技術(shù),從硬件上對Java虛擬機提供支持。 Jazelle DBX(Direct Bytecode eXecution)是一種硬件架構擴展技術(shù),為ARM處理器引入了第三套指令集—Java字節碼。新指令集建立了一種新的狀態(tài),處理器在此狀態(tài)下處理Java字節碼取指令、譯碼和維護Java操作數棧等任務(wù)。允許它們在某些架構的硬件上加速執行Java字節碼,就如其他執行模式般,它能在現存的ARM與Thumb模式之間互相切換。為了降低芯片尺寸并提高性能,Jazelle DBX沒(méi)有設計成傳統形式的微引擎,而是融入流水線(xiàn)中的一個(gè)有限狀態(tài)機。如圖2.2所示 Jazelle DBX技術(shù)增加了一條新的“Branch-to-Java”指令來(lái)進(jìn)入Java狀態(tài)。此指令支持條件執行,先檢查條件標志,如果條件滿(mǎn)足,處理器進(jìn)入Java狀態(tài),跳轉到指定目標地址,開(kāi)始執行Java字節碼。在Java狀態(tài)下,PC寄存器仍是32位尋址Java字節代碼。字節碼的取指、譯碼分別在兩個(gè)流水段完成(對應ARM/Thumb狀態(tài)下為一個(gè)譯碼流水級)。32位的取指令操作一次性可以取4個(gè)Java字節碼,性能優(yōu)勢十分明顯,對于一個(gè)高度優(yōu)化的商業(yè)Java虛擬機,運行評測程序或復雜的MIDP2.0應用,Jazelle DBX技術(shù)通??蓭?lái)約2~4倍的性能提升。Jazelle DBX技術(shù)允許所有的Java指令是“可重新開(kāi)始”的。這樣在執行Java指令過(guò)程中,即刻響應中斷,從而減少中斷延遲,確保實(shí)時(shí)性能。 在A(yíng)RM處理器的Java狀態(tài)下,有若干個(gè)ARM寄存器可以功能復用(包括棧指針、棧頂四項(top4 elements of stack)、局部變量0等)。正是這些硬件復用設計,才使得只用了很少的額外邏輯(約一萬(wàn)兩千門(mén))就實(shí)現了一個(gè)Java機。把所有Jazelle DBX擴展所需的狀態(tài)用ARM寄存器保存,也保證了和現有操作系統、中斷處理程序和異常處理代碼的兼容性。把棧頂四項保存在A(yíng)RM寄存器中也能提高Java性能。大量的程序分析顯示,大多數程序的棧深度是很小的,所以這項策略可以盡量減少內存訪(fǎng)問(wèn),硬件也可自動(dòng)處理棧溢出或下溢。 和Java協(xié)處理器或其它專(zhuān)用Java處理器設計不同的是,Jazelle DBX和主處理器共用緩存,這一方面能夠降低功耗,而且還可以提高性能。另一個(gè)重要的設計考慮是確保Jazelle DBX技術(shù)不會(huì )影響實(shí)時(shí)中斷性能,仍保持與操作系統中已有ARM異常處理代碼的兼容。圖2.3是在加入了Jazelle的ARM處理器中運行Java應用的垂直架構架圖。 圖2.3加入了Jazelle的ARM處理器上的Java應用垂直架構圖
評論