ARM C C++內存對齊
ARM 編譯程序通常將全局變量對齊到自然尺寸邊界上,以便通過(guò)使用 LDR和 STR 指令有效地存取這些變量。這種內存訪(fǎng)問(wèn)方式與多數 CISC (Complex Instruction Set Computing)體系結構不同,在CISC體系結構下,指令直接存取未對齊的數據。因而,當需要將代碼從CISC 體系結構向 ARM 處理器移植時(shí),內存訪(fǎng)問(wèn)的地址對齊問(wèn)題必須予以注意。在RISC體系結構下,存取未對齊數據無(wú)論在代碼尺寸或是程序執行效率上,都將付出非常大的代價(jià)。
本文將從以下幾個(gè)方面討論在A(yíng)RM體系結構下的程序設計問(wèn)題。
未對齊的數據指針
C和C++編程標準規定,指向某一數據類(lèi)型的指針,必須和該類(lèi)型的數據地址對齊方式一致,所以ARM 編譯器期望程序中的 C 指針指向存儲器中字對齊地址,因為這可使編譯器生成更高效的代碼。
比如,如果定義一個(gè)指向 int 數據類(lèi)型的指針,用該指針讀取一個(gè)字,ARM 編譯器將使用LDR 指令來(lái)完成此操作。如果讀取的地址為四的倍數(即在一個(gè)字的邊界)即能正確讀取。但是,如果該地址不是四的倍數,那么,一條 LDR 指令返回一個(gè)循環(huán)移位結果,而不是執行真正的未對齊字載入。循環(huán)移位結果取決于該地址向對于字的邊界的偏移量和系統所使用的端序(Endianness)。例如,如果代碼要求從指針指向的地址 0x8006 載入數據,即要載入 0x8006、0x8007、0x8008 和 0x8009 四字節的內容。但是,在 ARM 處理器上,這個(gè)存取操作載入了0x8004、0x8005、0x8006 和 0x8007 字節的內容。這就是在未對齊的地址上使用指針存取所得到的循環(huán)移位結果。
因而,如果想將指針定義到一個(gè)指定地址(即該地址為非自然邊界對齊),那么在定義該指針時(shí),必須使用 __packed 限定符來(lái)定義指針: 例如,
__packed int *pi; // 指針指向一個(gè)非字對其內存地址
使用了_packed限定符限定之后,ARM 編譯器將產(chǎn)生字節存取命令(LDRB或STRB指令)來(lái)存取內存,這樣就不必考慮指針對齊問(wèn)題。所生成的代碼是字節存取的一個(gè)序列,或者取決于編譯選項、跟變量對齊相關(guān)的移位和屏蔽。但這會(huì )導致系統性能和代碼密度的損失。
值得注意的是,不能使用 __packed 限定的指針來(lái)存取存儲器映射的外圍寄存器,因為 ARM 編譯程序可使用多個(gè)存儲器存取來(lái)獲取數據。因而,可能對實(shí)際存取地址附近的位置進(jìn)行存取,而這些附近的位置可能對應于其它外部寄存器。當使用了位字段(Bitfield)時(shí), ARM 程序將訪(fǎng)問(wèn)整個(gè)結構體,而非指定字段。
在A(yíng)RM中,通常希望字單元的地址是字對齊的(地址的低兩位為0b00),半字單元的地址是半字對齊的(地址的最低為0b0).在存儲訪(fǎng)問(wèn)操作中,如果存儲單元的地址沒(méi)有遵守上述的對齊規則,則稱(chēng)為非對齊(unaligned)的存儲訪(fǎng)問(wèn)操作.
代碼中關(guān)于對齊的隱患,很多是隱式的。比如在強制類(lèi)型轉換的時(shí)候。例如:
unsigned int i = 0×12345678;
unsigned char *p=NULL;
unsigned short *p1=NULL;
p=&i;
*p=0×00;
p1=(unsigned short *)(p+1);
*p1=0×0000;
最后兩句代碼,從奇數邊界去訪(fǎng)問(wèn)unsignedshort型變量,顯然不符合對齊的規定。
在x86上,類(lèi)似的操作只會(huì )影響效率,但是在MIPS或者sparc上,可能就是一個(gè)error,因為它們要求必須字節對齊.
有部分摘自ARM編譯器文檔對齊部分
對齊的使用:
1.__align(num)
這個(gè)用于修改最高級別對象的字節邊界。在匯編中使用LDRD或者STRD時(shí)
就要用到此命令__align(8)進(jìn)行修飾限制。來(lái)保證數據對象是相應對齊。
這個(gè)修飾對象的命令最大是8個(gè)字節限制,可以讓2字節的對象進(jìn)行4字節
對齊,但是不能讓4字節的對象2字節對齊。
__align是存儲類(lèi)修改,他只修飾最高級類(lèi)型對象不能用于結構或者函數對象。
2.__packed
__packed是進(jìn)行一字節對齊
1.不能對packed的對象進(jìn)行對齊
2.所有對象的讀寫(xiě)訪(fǎng)問(wèn)都進(jìn)行非對齊訪(fǎng)問(wèn)
3.float及包含float的結構聯(lián)合及未用__packed的對象將不能字節對齊
4.__packed對局部整形變量無(wú)影響
5.強制由unpacked對象向packed對象轉化是未定義,整形指針可以合法定
義為packed。
__packed int* p; //__packed int 則沒(méi)有意義
6.對齊或非對齊讀寫(xiě)訪(fǎng)問(wèn)帶來(lái)問(wèn)題
__packed struct STRUCT_TEST
{
char a;
int b;
char c;
} ; //定義如下結構此時(shí)b的起始地址一定是不對齊的
//在棧中訪(fǎng)問(wèn)b可能有問(wèn)題,因為棧上數據肯定是對齊訪(fǎng)問(wèn)[from CL]
//將下面變量定義成全局靜態(tài)不在棧上
static char* p;
static struct STRUCT_TEST a;
void Main()
{
__packed int* q; //此時(shí)定義成__packed來(lái)修飾當前q指向為非對齊的數據地址下面的訪(fǎng)問(wèn)則可以
p = (char*)&a;
q = (int*)(p+1);
*q = 0×87654321;
/*
得到賦值的匯編指令很清楚
ldr r5,0×20001590 ; = #0×12345678
[0xe1a00005] mov r0,r5
[0xeb0000b0] bl __rt_uwrite4 //在此處調用一個(gè)寫(xiě)4byte的操作函數
[0xe5c10000] strb r0,[r1,#0] //函數進(jìn)行4次strb操作然后返回保證了數據正確的訪(fǎng)問(wèn)
[0xe1a02420] mov r2,r0,lsr #8
[0xe5c12001] strb r2,[r1,#1]
[0xe1a02820] mov r2,r0,lsr #16
[0xe5c12002] strb r2,[r1,#2]
[0xe1a02c20] mov r2,r0,lsr #24
[0xe5c12003] strb r2,[r1,#3]
[0xe1a0f00e] mov pc,r14
*/
/*
如果q沒(méi)有加__packed修飾則匯編出來(lái)指令是這樣直接會(huì )導致奇地址處訪(fǎng)問(wèn)失敗
[0xe59f2018] ldr r2,0×20001594 ; = #0×87654321
[0xe5812000] str r2,[r1,#0]
*/
評論