ARMv7的Cortex系列微處理器技術(shù)特點(diǎn)
摘要 ARMv7是目前ARM處理器體系結構的最高版本。本文介紹了基于A(yíng)RMv7的最新ARM微處理器Cortex系列,描述了該系列處理器的技術(shù)細節,同時(shí)重點(diǎn)論述了Cortex-R、Cortex-A、Cortex-M系列處理器的技術(shù)特點(diǎn)。最后,對不同系列處理器的應用領(lǐng)域作了進(jìn)一步的闡述。
本文引用地址:http://dyxdggzs.com/article/79977.htm關(guān)鍵詞 ARMv7 體系結構 Cortex-M Cortex-R Cortex-A
引 言
隨著(zhù)嵌入式技術(shù)應用領(lǐng)域的不斷擴展,對嵌入式系統的要求越來(lái)越高,而作為嵌入式系統核心的微處理器也面臨日益嚴竣的挑戰。ARM公司從成立以來(lái),一直以知識產(chǎn)權(IP,Intelligence Property)提供者的身份出售知識產(chǎn)權,在32位RISC CPU開(kāi)發(fā)領(lǐng)域中不斷取得突破,其設計的微處理器結構已經(jīng)從v3發(fā)展到現在的v7。Cortex系列處理器是基于A(yíng)RMv7架構的,分為Cortcx-M、Cortex-R和Cortex-A三類(lèi)。ARM系列微處理器的核心及體系結構如表l所列。
1 ARM Correx處理器技術(shù)特點(diǎn)
ARMv7架構是在A(yíng)RMv6架構的基礎上誕生的。該架構采用了Thumb-2技術(shù),它是在A(yíng)RM的Thumb代碼壓縮技術(shù)的基礎上發(fā)展起來(lái)的,并且保持了對現存ARM解決方案的完整的代碼兼容性。Thumb-2技術(shù)比純32位代碼少使用31%的內存,減小了系統開(kāi)銷(xiāo),同時(shí)能夠提供比已有的基于Thumb技術(shù)的解決方案高出38%的性能。ARMv7架構還采用丁NEON技術(shù),將DSP和媒體處理能力提高了近4倍。并支持改良的浮點(diǎn)運算,滿(mǎn)足下一代3D圖形、游戲物理應用以及傳統嵌入式控制應用的需求。此外,ARMv7還支持改良的運行環(huán)境,以迎合不斷增加的JIT(Just In Time)和DAC(DynamicAdaptlve Compilation)技術(shù)的使用。
在與早期的ARM處理器軟件兼容性方而,ARMv7架構在設計時(shí)充分考慮到了。ARM Cortex-M系列支持Thumb-2指令集(Thumb指令集的擴展集),可以執行所有已存的為早期處理器編寫(xiě)的代碼。通過(guò)一個(gè)前向的轉換方式,為ARM Cortex-M系列處理器所寫(xiě)的用戶(hù)代碼可以與ARM Cortex-R系列微處理器完全兼容。ARMCortex-M系列系統代碼(如實(shí)時(shí)操作系統)可以很容易地移植到基于A(yíng)RMCortex-R系列的系統上。ARMCortex-A和Cortex-R系列處理器還支持ARM 32位指令集,向后完全兼容早期的ARM處理器,包括從1995年發(fā)布的ARM7TDMI處理器到2002年發(fā)布的ARMll處理器系列。圖1為v5~v7架構的處理器技術(shù)比較。由于應用領(lǐng)域的不同,基于v7架構的Cortex處理器系列所采用的技術(shù)也不相同。
在命名方式上,基于A(yíng)RMv7架構的ARM處理器已經(jīng)不再延用過(guò)去的數字命名方式,而是冠以Cortex的代呼?;趘7A的稱(chēng)為“Cortex-A系州”,基于v7R的稱(chēng)為“Cortex-R系列”,基于v7M的稱(chēng)為“Cortex-M3”。
2 ARM CorteX-M3處理器技術(shù)特點(diǎn)
ARM Cortex-M3處理器是為存儲器和處理器的尺寸對產(chǎn)品成本影響極大的各種應用專(zhuān)門(mén)開(kāi)發(fā)沒(méi)計的,其結構如圖2所示。它整合了多種技術(shù),減少使用內存,并在極小的RISC內核上提供低功耗和高性能,可實(shí)現由以往的代碼向32位微控制器的快速移植。ARM Cortex-M3處理器是使用最少門(mén)數的ARM CPU,相對于過(guò)去的設計大大減小了芯片面積,可減小裝置的體積或采用更低成本的工藝進(jìn)行生產(chǎn),僅33000門(mén)的內核性能可達l,2DMIPS/MHz。此外,基本系統外設還具備高度集成化特點(diǎn),集成了許多緊耦合系統外設,合理利用了芯片空間,使系統滿(mǎn)足下一代產(chǎn)品的控制需求。
ARM Cortex-M3處理器結合了執行Thumb-2指令的32位哈佛微體系結構和系統外設,包括Nested Vectored Interrupt Controller和Arbiter總線(xiàn)。該技術(shù)方案在測試和實(shí)例應用中表現出較高的性能:在臺機電180 nm工藝下,芯片性能達1.2 DMIPS/MHz,時(shí)鐘頻率高達l00 MHz。Cortex-M3處理器還實(shí)現了Tail-Chaining中斷技術(shù)。該技術(shù)是一項完全基于硬件的中斷處理技術(shù),最多可減少12個(gè)時(shí)鐘周期數,在實(shí)際應用中可減少70%中斷;推出了新的單線(xiàn)調試技術(shù),避免使用多引腳進(jìn)行JTAG調試,并全面支持RealVicw編譯器和RealView調試產(chǎn)品。Realview工具向設計者提供模擬、創(chuàng )建虛擬模型、編譯軟件、調試、驗證和測試基于A(yíng)RMv7架構的系統等功能。
為微控制器應用而開(kāi)發(fā)的Cortex-M3擁有以下性能:
◇實(shí)現單周期Flash應用最優(yōu)化;
◇準確快速地中斷處理。永不超過(guò)12周期,僅6周期tail-chaining(末尾連鎖);
◇有低功耗時(shí)鐘門(mén)控(Clock Gating)的3種睡眠模式;
◇單周期乘法和乘法累加指令;
◇ARM Thumb-2混合的16/32位固有指令集,無(wú)模式轉換;
◇包括數據觀(guān)察點(diǎn)和Flash補丁在內的高級調試功能;
◇原子位操作,在一個(gè)單一指令中讀取/修改/編寫(xiě);
◇1.25DMIPS/MHz(與0.9DMIPS/MHz的ARM7和1.1DMIPS/MHz的ARM9相比)。
3 ARM Cortex-R處理器技術(shù)特點(diǎn)
ARM Cortex-R系列處理器目前包括ARM CortexR4和ARM Cortex-R4F兩個(gè)型號,主要適用于實(shí)時(shí)系統的嵌入式處理器。
3.1 ARM Cortex-R4處理器技術(shù)特點(diǎn)
Cortex-R4處理器結構如圖3所示。該處理器支持手機、硬盤(pán)、打印機及汽車(chē)電子設計,能協(xié)助新一代嵌入式產(chǎn)品快速執行各種復雜的控制算法與實(shí)時(shí)工作的運算;可通過(guò)內存保護單元(MPU,Memory Protection Unit)、高速緩存以及緊密耦合內存(TCM,Tightly Coupled Mennory)讓處理器針對各種不同的嵌入式應用進(jìn)行最佳化調整,且不影響基本的ARM指令集兼容性。這種設計能夠在延用原有程序代碼的情況下,降低系統的成本與復雜度,同時(shí)其緊密耦合內存功能也能提供更小的規格及更高效率的整合,并帶來(lái)快速的響應時(shí)聞。
Cortex-R4處理器采用ARMv7體系結構,讓它能與現有的程序維持完全的回溯兼容性,能支持現今建立在全球各地數十億的系統;并已針對Thumb-2指令進(jìn)行最佳化設計。此項特性帶來(lái)很多的利益,其中包括:更低的時(shí)鐘速度所帶來(lái)的省電效益;更高的性能將各種多功能特色帶入移動(dòng)電話(huà)與汽車(chē)產(chǎn)品的設計;更復雜的算法支持更高性能的數碼影像與內建硬盤(pán)的系統。運用Thumb-2指令集,加上RealView開(kāi)發(fā)套件,使芯片內部存儲器的容量最多得以降低30%,大幅降低系統成本,其速度比在A(yíng)RM9tt6E-S處理器所使用的Thumb指令集高出40%。由于存儲器在芯片中的占用空間愈來(lái)愈多,因此這項設計將大幅節省芯片容量,讓芯片制造商運用這款處理器開(kāi)發(fā)各種SoC(System on a Chip)器件。
相比于前幾代的處理器,Cortex-R4處理器高效率的設計方案,使其能以更低的時(shí)鐘達到更高的性能;經(jīng)過(guò)最佳化設計的Artisan Mctro內存,則進(jìn)一步降低嵌入式系統的體積與成本。處理器搭載一個(gè)先進(jìn)的微架構,具備雙指令發(fā)送功能,采用90nm工藝并搭配Artisan Advantage程序庫的組件,底面積不到lmm2,耗電最低于0.27mW/MHz,并能提供超過(guò)600 DMIPS的性能。
Cortex-R4處理器在各種安全應用上加入容錯功能和內存保護機制,支持最新版OSEK實(shí)時(shí)操作系統;支持RealView Develop系列軟件開(kāi)發(fā)工具、RealView Create系列ESL工具與模塊,以及Core Sight除錯與追蹤技術(shù),協(xié)助設計者迅速開(kāi)發(fā)各種嵌入式系統。
3.2 ARM Correx-R4F處理器技術(shù)特點(diǎn)
Cortex-R4F處理器結構如圖4所示。該處理器擁有針對汽車(chē)市場(chǎng)而開(kāi)發(fā)的各項先進(jìn)功能,包括自動(dòng)除錯功能、可相互連結的錯誤偵測機制,以及可選擇優(yōu)化的浮點(diǎn)運算單元(FPU,Floating-Point Unit)。ECC技術(shù)能監控內存存取作業(yè),偵測并校正各種錯誤。當發(fā)生內存錯誤時(shí),ECC邏輯除通報錯誤并停止系統運作外,還會(huì )加以校正。它還擁有Cortex-R4系列的各項先進(jìn)功能,能夠透過(guò)高效能內存保護單元、高速緩存,以及緊密耦合內存,使處理器能針對各種不同的應用進(jìn)行最佳化調整;同時(shí)將傳統處理器中的錯誤偵測功能延伸至整個(gè)SoC中,系統會(huì )不斷地掃描先前偵錯的資料,以提升系統的可靠度?;趯Π踩阅艿闹匾?,Cortex-R4F處理器特別搭載了高分辨率內存保護機制,能?chē)烂芸刂篇毩⒌能浖鳂I(yè)。
Cortex-R4F處理器中執行浮點(diǎn)運算的FPU,提供勝過(guò)固定小數點(diǎn)操作數的動(dòng)態(tài)范圍及精準度。該FPU與ARM其他處理器核心之間的FPU均維持同溯兼容性,并針對各種汽車(chē)應用常見(jiàn)的單精度處理作業(yè)進(jìn)行優(yōu)化。使用單倍精度格式,而非雙倍精度的數值資料,不僅能將數據處理速度提升至2倍,更能維持必要的精度以提高SoC設計的效率。
Conex-R4F處理器采用一套具備雙指令發(fā)送功能的先進(jìn)微架構,透過(guò)ARM Artisan Advantage程序庫中針對90nm工藝的優(yōu)化,達到超過(guò)800 DMIPS的性能水準。Levcl 1內存松散的時(shí)序設計,使組件能使用高密度、低功耗的RAM,使在總成本中占有高比重的內存,能像處理器邏輯一樣擁有節省空間的優(yōu)勢。在90 nm工藝下,占用空間不到1 mm2,且耗電量不到0.27 mW/MHz,有效地協(xié)助系統開(kāi)發(fā)者降低成本與功耗。該處理器采用ARMv7ISA架構,能與已被全球數十億臺系統所采用的ARM程序代碼維持回溯兼容性,并針對Thumab-2指令集進(jìn)行最優(yōu)化設計。運用ThLtmb-2指令,搭配ARM RealView開(kāi)發(fā)套件,使芯片內部存儲器的容量最大能縮減30%,大幅降低系統成本。此外,相較于內建在A(yíng)RM946E-S處理器的舊版Thumb指令集,新技術(shù)能夠提高40%的工作效能。
4 ARM Cortex-A8處理器技術(shù)特點(diǎn)
ARM Cortex-A8處理器是一款適用于復雜操作系統及用戶(hù)應用的應用處理器,其結構如圖5所示。支持智能能源管理(IEM,Inte11igent Energy Manger)技術(shù)的ARM Artisan庫以及先進(jìn)的泄漏控制技術(shù),使得Cortex-A8處理器實(shí)現了非凡的速度和功耗效率。在65nm工藝下,ARM Conex-A8處理器的功耗不到300mw,能夠提供高性能和低功耗。它第一次為低費用、高容量的產(chǎn)品帶來(lái)了臺式機級別的性能。
Conex-A8處理器是第一款基于下一代ARMv7架構的應用處理器,使用了能夠帶來(lái)更高性能、更低功耗和更高代碼密度的Thumb-2技術(shù)。它首次采用了強大的NEON信號處理擴展集,為H.264和MP3等媒體編解碼提供加速。Cortex-A8的解決方案還包括Jazelle-RCTJava加速技術(shù),對實(shí)時(shí)(JTT)和動(dòng)態(tài)調整編譯(DAC)提供最優(yōu)化,同時(shí)減少內存占用空間高達3倍。該處理器配置了先進(jìn)的超標量體系結構流水線(xiàn),能夠同時(shí)執行多條指令,并且提供超過(guò)2.ODMIPS/MHz的性能。處理器集成了一個(gè)可調尺寸的二級高速緩沖存儲器,能夠同高速的16KB或者32KB一級高速緩沖存儲器一起工作,從而達到最快的讀取速度和最大的吞吐量。新處理器還配置了用于安全交易和數宇版權管理的Trust Zone技術(shù),以及實(shí)現低功耗管理的IEM功能。
Cortex-A8處理器使用了先進(jìn)的分支預測技術(shù),并且具有專(zhuān)用的NEON整型和浮點(diǎn)型流水線(xiàn)進(jìn)行媒體和信號處理。在使用小于4mm2的硅片及低功耗的65 nm工藝的情況下,Cortex-A8處理器的運行頻率將高于600MHz(不包括NEON追蹤技術(shù)和二級高速緩沖存儲器)。在高性能的90nm和65nm 工藝下,Cortex-A8處理器運行頻率最高可達1GHz,能夠滿(mǎn)足高性能消費產(chǎn)品設計的需要。
結語(yǔ)
這些新的ARM Conex處理器系列都是基于A(yíng)RMv7架構的產(chǎn)品,從尺寸和性能方面來(lái)看,既有少于33 000個(gè)門(mén)電路的ARM Cortex-M系列,也有高性能的ARMCortex-A系列。其中,ARM Cortex-A系列是針對日益增長(cháng)的,運行包括Linux、Windows CE和Symhian操作系統在內的消費者娛樂(lè )和無(wú)線(xiàn)產(chǎn)品設計的;ARM Cortex-R系列針對的是需要運行實(shí)時(shí)操作系統來(lái)進(jìn)行控制應用的系統,包括汽車(chē)電子、網(wǎng)絡(luò )和影像系統;ARM Cortex-M系列則是為那些對開(kāi)發(fā)費用非常敏感同時(shí)對性能要求不斷增加的嵌入式應用(如微控制器、汽車(chē)車(chē)身控制系統和各種大型家電)所設計的。隨著(zhù)在各種不同領(lǐng)域應用需求的增加,微處理器市場(chǎng)也在趨于多樣化。為了適應市場(chǎng)的發(fā)展變化,基于A(yíng)RMv7架構的ARM處理器系列將不斷拓展自己的應用領(lǐng)域。
評論