關(guān)于調用約定(cdecl、fastcall、fastcall、thiscall)
在C語(yǔ)言中,假設我們有這樣的一個(gè)函數:
int function(int a,int b)
調用時(shí)只要用result = function(1,2)這樣的方式就可以使用這個(gè)函數。但是,當高級
語(yǔ)言被編譯成計算機可以識別的機器碼時(shí),有一個(gè)問(wèn)題就凸現出來(lái):在CPU中,計算機沒(méi)有辦法知道一個(gè)函數調用需要多少個(gè)、什么樣的參數,也沒(méi)有硬件可以保存這些參數。
也就是說(shuō),計算機不知道怎么給這個(gè)函數傳遞參數,傳遞參數的工作必須由函數調用者和函數本身來(lái)協(xié)調。為此,計算機提供了一種被稱(chēng)為棧的數據結構來(lái)支持參數傳遞。
棧是一種先進(jìn)后出的數據結構,棧有一個(gè)存儲區、一個(gè)棧頂指針。棧頂指針指向堆棧中第一個(gè)可用的數據項(被稱(chēng)為棧頂)。用戶(hù)可以在棧頂上方向棧中加入數據,這個(gè)操作被稱(chēng)為壓棧(Push),壓棧以后,棧頂自動(dòng)變成新加入數據項的位置,棧頂指針也隨之修改。用戶(hù)也可以從堆棧中取走棧頂,稱(chēng)為彈出棧(pop),彈出棧后,棧頂下的一個(gè)元素變成棧頂,棧頂指針隨之修改。
函數調用時(shí),調用者依次把參數壓棧,然后調用函數,函數被調用以后,在堆棧中取得數據,并進(jìn)行計算。函數計算結束以后,或者調用者、或者函數本身修改堆棧,使堆?;謴驮b。
在參數傳遞中,有兩個(gè)很重要的問(wèn)題必須得到明確說(shuō)明:
當參數個(gè)數多于一個(gè)時(shí),按照什么順序把參數壓入堆棧函數調用后,由誰(shuí)來(lái)把堆?;謴驮b在高級語(yǔ)言中,通過(guò)函數調用約定來(lái)說(shuō)明這兩個(gè)問(wèn)題。常見(jiàn)的調用約定有:
stdcall、cdecl、fastcall、thiscall、naked call
stdcall調用約定
stdcall很多時(shí)候被稱(chēng)為pascal調用約定,因為pascal是早期很常見(jiàn)的一種教學(xué)用計算機程序設計語(yǔ)言,其語(yǔ)法嚴謹,使用的函數調用約定就是stdcall。在Microsoft C++系列的C/C++編譯器中,常常用PASCAL宏來(lái)聲明這個(gè)調用約定,類(lèi)似的宏還有WINAPI和CALLBACK。
stdcall調用約定聲明的語(yǔ)法為(以前文的那個(gè)函數為例):
int __stdcall function(int a,int b)
stdcall的調用約定意味著(zhù):1)參數從右向左壓入堆棧,2)函數自身修改堆棧 3)函數名自動(dòng)加前導的下劃線(xiàn),后面緊跟一個(gè)@符號,其后緊跟著(zhù)參數的尺寸以上述這個(gè)函數為例,參數b首先被壓棧,然后是參數a,函數調用function(1,2)調用處翻譯成匯編語(yǔ)言將變成:
push 2 第二個(gè)參數入棧
push 1 第一個(gè)參數入棧
call function 調用參數,注意此時(shí)自動(dòng)把cs:eip入棧
而對于函數自身,則可以翻譯為:
push ebp 保存ebp寄存器,該寄存器將用來(lái)保存堆棧的棧頂指針,可以在函數退出
時(shí)恢復mov ebp,esp 保存堆棧指針
mov eax,[ebp + 8H] 堆棧中ebp指向位置之前依次保存有ebp,cs:eip,a,b,ebp +8指向
a
add eax,[ebp + 0CH] 堆棧中ebp + 12處保存了b
mov esp,ebp 恢復esp
pop ebp
ret 8
而在編譯時(shí),這個(gè)函數的名字被翻譯成_function@8
注意不同編譯器會(huì )插入自己的匯編代碼以提供編譯的通用性,但是大體代碼如此。其中在函數開(kāi)始處保留esp到ebp中,在函數結束恢復是編譯器常用的方法。
從函數調用看,2和1依次被push進(jìn)堆棧,而在函數中又通過(guò)相對于ebp(即剛進(jìn)函數時(shí)的堆棧指針)的偏移量存取參數。函數結束后,ret 8表示清理8個(gè)字節的堆棧,函數自己恢復了堆棧。
cdecl調用約定
cdecl調用約定又稱(chēng)為C調用約定,是C語(yǔ)言缺省的調用約定,它的定義語(yǔ)法是:
int function (int a ,int b) //不加修飾就是C調用約定
int __cdecl function(int a,int b)//明確指出C調用約定
在寫(xiě)本文時(shí),出乎我的意料,發(fā)現cdecl調用約定的參數壓棧順序是和stdcall是一樣的,參數首先由有向左壓入堆棧。所不同的是,函數本身不清理堆棧,調用者負責清理堆棧。由于這種變化,C調用約定允許函數的參數的個(gè)數是不固定的,這也是C語(yǔ)言的一大特色。對于前面的function函數,使用cdecl后的匯編碼變成:
調用處
push 1
push 2
call function
add esp,8 注意:這里調用者在恢復堆棧
被調用函數_function處
push ebp 保存ebp寄存器,該寄存器將用來(lái)保存堆棧的棧頂指針,可以在函數退出
時(shí)恢復mov ebp,esp 保存堆棧指針mov eax,[ebp + 8H] 堆棧中ebp指向位置之前依次保存有ebp,cs:eip,a,b,ebp +8指向a add eax,[ebp + 0CH] 堆棧中ebp + 12處保存了b
mov esp,ebp 恢復esp
pop ebp
ret 注意,這里沒(méi)有修改堆棧。
MSDN中說(shuō),該修飾自動(dòng)在函數名前加前導的下劃線(xiàn),因此函數名在符號表中被記錄為_(kāi)function,但是我在編譯時(shí)似乎沒(méi)有看到這種變化。
由于參數按照從右向左順序壓棧,因此最開(kāi)始的參數在最接近棧頂的位置,因此當采用不定個(gè)數參數時(shí),第一個(gè)參數在棧中的位置肯定能知道,只要不定的參數個(gè)數能夠根據第一個(gè)后者后續的明確的參數確定下來(lái),就可以使用不定參數,例如對于CRT中的sprintf函數,定義為:
int sprintf(char* buffer,const char* format,...)
由于所有的不定參數都可以通過(guò)format確定,因此使用不定個(gè)數的參數是沒(méi)有問(wèn)題的。
fastcall
fastcall調用約定和stdcall類(lèi)似,它意味著(zhù):
函數的第一個(gè)和第二個(gè)DWORD參數(或者尺寸更小的)通過(guò)ecx和edx傳遞,其他參數通過(guò)從右向左的順序壓棧被調用函數清理堆棧
函數名修改規則同stdcall
其聲明語(yǔ)法為:int fastcall function(int a,int b)
thiscall
thiscall是唯一一個(gè)不能明確指明的函數修飾,因為thiscall不是關(guān)鍵字。它是C++類(lèi)成
員函數缺省的調用約定。由于成員函數調用還有一個(gè)this指針,因此必須特殊處理,thiscall意味著(zhù):
參數從右向左入棧
如果參數個(gè)數確定,this指針通過(guò)ecx傳遞給被調用者;如果參數個(gè)數不確定,this指針在所有參數壓棧后被壓入堆棧。
對參數個(gè)數不定的,調用者清理堆棧,否則函數自己清理堆棧為了說(shuō)明這個(gè)調用約定,定義如下類(lèi)和使用代碼:
class A
{
public:
int function1(int a,int b);
int function2(int a,...);
};
int A::function1 (int a,int b)
{
return a+b;
}
#i nclude
int A::function2(int a,...)
{
va_list ap;
va_start(ap,a);
int i;
int result = 0;
for(i = 0 i < a i ++)
{
result += va_arg(ap,int);
}
return result;
}
void callee()
{
A a;
a.function1 (1,2);
a.function2(3,1,2,3);
}
callee函數被翻譯成匯編后就變成:
//函數function1調用
0401C1D push 2
00401C1F push 1
00401C21 lea ecx,[ebp-8]
00401C24 call function1 注意,這里this沒(méi)有被入棧
//函數function2調用
00401C29 push 3
00401C2B push 2
00401C2D push 1
00401C2F push 3
00401C31 lea eax,[ebp-8] 這里引入this指針
00401C34 push eax
00401C35 call function2
00401C3A add esp,14h
可見(jiàn),對于參數個(gè)數固定情況下,它類(lèi)似于stdcall,不定時(shí)則類(lèi)似cdecl
naked call
這是一個(gè)很少見(jiàn)的調用約定,一般程序設計者建議不要使用。編譯器不會(huì )給這種函數增加初始化和清理代碼,更特殊的是,你不能用return返回返回值,只能用插入匯編返回結果。這一般用于實(shí)模式驅動(dòng)程序設計,假設定義一個(gè)求和的加法程序,可以定義為:
__declspec(naked) int add(int a,int b)
{
__asm mov eax,a
__asm add eax,b
__asm ret
}
注意,這個(gè)函數沒(méi)有顯式的return返回值,返回通過(guò)修改eax寄存器實(shí)現,而且連退出函數的ret指令都必須顯式插入。上面代碼被翻譯成匯編以后變成:
mov eax,[ebp+8]
add eax,[ebp+12]
ret 8
注意這個(gè)修飾是和__stdcall及cdecl結合使用的,前面是它和cdecl結合使用的代碼,對于和stdcall結合的代碼,則變成:
__declspec(naked) int __stdcall function(int a,int b)
{
__asm mov eax,a
__asm add eax,b
__asm ret 8 //注意后面的8
}
至于這種函數被調用,則和普通的cdecl及stdcall調用函數一致。
函數調用約定導致的常見(jiàn)問(wèn)題
如果定義的約定和使用的約定不一致,則將導致堆棧被破壞,導致嚴重問(wèn)題,下面是兩種常見(jiàn)的問(wèn)題:
函數原型聲明和函數體定義不一致
DLL導入函數時(shí)聲明了不同的函數約定
以后者為例,假設我們在dll種聲明了一種函數為:
__declspec(dllexport) int func(int a,int b);//注意,這里沒(méi)有stdcall,使用的是cdecl
使用時(shí)代碼為:
typedef int (*WINAPI DLLFUNC)func(int a,int b);
hLib = LoadLibrary(...);
DLLFUNC func = (DLLFUNC)GetProcAddress(...)//這里修改了調用約定
result = func(1,2);//導致錯誤
由于調用者沒(méi)有理解WINAPI的含義錯誤的增加了這個(gè)修飾,上述代碼必然導致堆棧被破壞,MFC在編譯時(shí)插入的checkesp函數將告訴你,堆棧被破壞了。
c語(yǔ)言相關(guān)文章:c語(yǔ)言教程
c++相關(guān)文章:c++教程
評論