C++虛函數和多態(tài)學(xué)習筆記
1、什么是虛函數和多態(tài)
虛函數是在類(lèi)中被聲明為virtual的成員函數,當編譯器看到通過(guò)指針或引用調用此類(lèi)函數時(shí),對其執行晚綁定,即通過(guò)指針(或引用)指向的類(lèi)的類(lèi)型信息來(lái)決定該函數是哪個(gè)類(lèi)的。通常此類(lèi)指針或引用都聲明為基類(lèi)的,它可以指向基類(lèi)或派生類(lèi)的對象。
多態(tài)指同一個(gè)方法根據其所屬的不同對象可以有不同的行為(根據自己理解,不知這么說(shuō)是否嚴謹)。
舉個(gè)例子說(shuō)明虛函數、多態(tài)、早綁定和晚綁定:
李氏兩兄妹(哥哥和妹妹)參加姓氏運動(dòng)會(huì )(不同姓氏組隊參加),哥哥男子項目比賽,妹妹參加女子項目比賽,開(kāi)幕式有一個(gè)參賽隊伍代表發(fā)言?xún)x式,兄妹倆都想去露露臉,可只能一人去,最終他們決定到時(shí)抓鬮決定,而組委會(huì )也不反對,它才不關(guān)心是哥哥還是妹妹來(lái)發(fā)言,只要派一個(gè)姓李的來(lái)說(shuō)兩句話(huà)就行。運動(dòng)會(huì )如期舉行,妹妹抓鬮獲得代表李家發(fā)言的機會(huì ),哥哥參加了男子項目比賽,妹妹參加了女子項目比賽。比賽結果就不是我們關(guān)心的了。
現在讓我們來(lái)做個(gè)類(lèi)比(只討論與運動(dòng)會(huì )相關(guān)的話(huà)題):
(1)類(lèi)的設計:
李氏兄妹屬于李氏家族,李氏是基類(lèi)(這里還是抽象的純基類(lèi)),李氏又派生出兩個(gè)子類(lèi)(李氏男和李氏女),李氏男會(huì )所有男子項目的比賽(李氏男的成員函數),李氏女會(huì )所有女子項目的比賽(李氏女的成員函數)。姓李的人都會(huì )發(fā)言(基類(lèi)虛函數),李氏男和李氏女繼承自李氏當然也會(huì )發(fā)言,只是男女說(shuō)話(huà)聲音不一樣,內容也會(huì )又差異,給人感覺(jué)不同(李氏男和李氏女分別重新定義發(fā)言這個(gè)虛函數)。李氏兩兄妹就是李氏男和李氏女兩個(gè)類(lèi)的實(shí)體。
(2)程序設計:
李氏兄妹填寫(xiě)參賽報名表。
(3)編譯:
李氏兄妹的參賽報名表被上交給組委會(huì )(編譯器),哥哥和妹妹分別參加男子和女子的比賽,組委會(huì )一看就明白了(早綁定),只是發(fā)言人選不明確,組委會(huì )看到報名表上寫(xiě)的是“李家代表”(基類(lèi)指針),組委會(huì )不能確定到底是誰(shuí),就做了個(gè)備注:如果是男的,就是哥哥李某某;如果是女的,就是妹妹李某某(晚綁定)。組委會(huì )做好其它準備工作后,就等運動(dòng)會(huì )開(kāi)始了(編譯完畢)。
(4)程序運行:
運動(dòng)會(huì )開(kāi)始了(程序開(kāi)始運行),開(kāi)幕式上我們聽(tīng)到了李家妹妹的發(fā)言,如果是哥哥運氣好抓鬮勝出,我們將聽(tīng)到哥哥的發(fā)言(多態(tài))。然后就是看到兄妹倆參加比賽了。。。
但愿這個(gè)比喻說(shuō)清楚了虛函數、多態(tài)、早綁定和晚綁定的概念和它們之間的關(guān)系。再說(shuō)一下,早綁定指編譯器在編譯期間即知道對象的具體類(lèi)型并確定此對象調用成員函數的確切地址;而晚綁定是根據指針所指對象的類(lèi)型信息得到類(lèi)的虛函數表指針進(jìn)而確定調用成員函數的確切地址。
2、揭密晚綁定的秘密
編譯器到底做了什么實(shí)現的虛函數的晚綁定呢?我們來(lái)探個(gè)究竟。
編譯器對每個(gè)包含虛函數的類(lèi)創(chuàng )建一個(gè)表(稱(chēng)為V TA B L E)。在V TA B L E中,編譯器放置特定類(lèi)的虛函數地址。在每個(gè)帶有虛函數的類(lèi)中,編譯器秘密地置一指針,稱(chēng)為v p o i n t e r(縮寫(xiě)為V P T R),指向這個(gè)對象的V TA B L E。通過(guò)基類(lèi)指針做虛函數調用時(shí)(也就是做多態(tài)調用時(shí)),編譯器靜態(tài)地插入取得這個(gè)V P T R,并在V TA B L E表中查找函數地址的代碼,這樣就能調用正確的函數使晚捆綁發(fā)生。為每個(gè)類(lèi)設置V TA B L E、初始化V P T R、為虛函數調用插入代碼,所有這些都是自動(dòng)發(fā)生的,所以我們不必擔心這些。利用虛函數,這個(gè)對象的合適的函數就能被調用,哪怕在編譯器還不知道這個(gè)對象的特定類(lèi)型的情況下。(《C++編程思想》)
在任何類(lèi)中不存在顯示的類(lèi)型信息,可對象中必須存放類(lèi)信息,否則類(lèi)型不可能在運行時(shí)建立。那這個(gè)類(lèi)信息是什么呢?我們來(lái)看下面幾個(gè)類(lèi):
class no_virtual
{
public:
void fun1() const{}
int fun2() const { return a; }
private:
int a;
}
class one_virtual
{
public:
virtual void fun1() const{}
int fun2() const { return a; }
private:
int a;
}
class two_virtual
{
public:
virtual void fun1() const{}
virtual int fun2() const { return a; }
private:
int a;
}
以上三個(gè)類(lèi)中:
no_virtual沒(méi)有虛函數,sizeof(no_virtual)=4,類(lèi)no_virtual的長(cháng)度就是其成員變量整型a的長(cháng)度;
one_virtual有一個(gè)虛函數,sizeof(one_virtual)=8;
two_virtual有兩個(gè)虛函數,sizeof(two_virtual)=8; 有一個(gè)虛函數和兩個(gè)虛函數的類(lèi)的長(cháng)度沒(méi)有區別,其實(shí)它們的長(cháng)度就是no_virtual的長(cháng)度加一個(gè)void指針的長(cháng)度,它反映出,如果有一個(gè)或多個(gè)虛函數,編譯器在這個(gè)結構中插入一個(gè)指針( V P T R)。在one_virtual 和two_virtual之間沒(méi)有區別。這是因為V P T R指向一個(gè)存放地址的表,只需要一個(gè)指針,因為所有虛函數地址都包含在這個(gè)表中。
這個(gè)VPTR就可以看作類(lèi)的類(lèi)型信息。
那我們來(lái)看看編譯器是怎么建立VPTR指向的這個(gè)虛函數表的。先看下面兩個(gè)類(lèi):
class base
{
public:
void bfun(){}
virtual void vfun1(){}
virtual int vfun2(){}
private:
int a;
}
class derived : public base
{
public:
void dfun(){}
virtual void vfun1(){}
virtual int vfun3(){}
private:
int b;
}
兩個(gè)類(lèi)VPTR指向的虛函數表(VTABLE)分別如下:
base類(lèi)
——————
VPTR——> |&base::vfun1 |
——————
|&base::vfun2 |
——————
derived類(lèi)
———————
VPTR——> |&derived::vfun1 |
———————
|&base::vfun2 |
———————
|&derived::vfun3 |
———————
每當創(chuàng )建一個(gè)包含有虛函數的類(lèi)或從包含有虛函數的類(lèi)派生一個(gè)類(lèi)時(shí),編譯器就為這個(gè)類(lèi)創(chuàng )建一個(gè)VTABLE,如上圖所示。在這個(gè)表中,編譯器放置了在這個(gè)類(lèi)中或在它的基類(lèi)中所有已聲明為virtual的函數的地址。如果在這個(gè)派生類(lèi)中沒(méi)有對在基類(lèi)中聲明為virtual的函數進(jìn)行重新定義,編譯器就使用基類(lèi)的這個(gè)虛函數地址。(在derived的VTABLE中,vfun2的入口就是這種情況。)然后編譯器在這個(gè)類(lèi)中放置VPTR。當使用簡(jiǎn)單繼承時(shí),對于每個(gè)對象只有一個(gè)VPTR。VPTR必須被初始化為指向相應的VTABLE,這在構造函數中發(fā)生。
一旦VPTR被初始化為指向相應的VTABLE,對象就"知道"它自己是什么類(lèi)型。但只有當虛函數被調用時(shí)這種自我認知才有用。
VPTR常常位于對象的開(kāi)頭,編譯器能很容易地取到VPTR的值,從而確定VTABLE的位置。VPTR總指向VTABLE的開(kāi)始地址,所有基類(lèi)和它的子類(lèi)的虛函數地址(子類(lèi)自己定義的虛函數除外)在VTABLE中存儲的位置總是相同的,如上面base類(lèi)和derived類(lèi)的VTABLE中vfun1和vfun2的地址總是按相同的順序存儲。編譯器知道vfun1位于VPTR處,vfun2位于VPTR+1處,因此在用基類(lèi)指針調用虛函數時(shí),編譯器首先獲取指針指向對象的類(lèi)型信息(VPTR),然后就去調用虛函數。如一個(gè)base類(lèi)指針pBase指向了一個(gè)derived對象,那pBase->vfun2()被編譯器翻譯為 VPTR+1 的調用,因為虛函數vfun2的地址在VTABLE中位于索引為1的位置上。同理,pBase->vfun3()被編譯器翻譯為 VPTR+2的調用。這就是所謂的晚綁定。
我們來(lái)看一下虛函數調用的匯編代碼,以加深理解。
void test(base* pBase)
{
pBase->vfun2();
}
int main(int argc, char* argv[])
{
derived td;
test(&td);
return 0;
}
derived td;編譯生成的匯編代碼如下:
mov DWORD PTR _td$[esp+24], OFFSET FLAT:??_7derived@@6B@ ; derived::`vftable'
由編譯器的注釋可知,此時(shí)PTR _td$[esp+24]中存儲的就是derived類(lèi)的VTABLE地址。
test(&td);編譯生成的匯編代碼如下:
lea eax, DWORD PTR _td$[esp+24]
mov DWORD PTR __$EHRec$[esp+32], 0
push eax
call test@@YAXPAVbase@@@Z ; test
調用test函數時(shí)完成了如下工作:取對象td的地址,將其壓棧,然后調用test。
pBase->vfun2();編譯生成的匯編代碼如下:
mov ecx, DWORD PTR _pBase$[esp-4]
mov eax, DWORD PTR [ecx]
jmp DWORD PTR [eax+4]
首先從棧中取出pBase指針指向的對象地址賦給ecx,然后取對象開(kāi)頭的指針變量中的地址賦給eax,此時(shí)eax的值即為VPTR的值,也就是VTABLE的地址。最后就是調用虛函數了,由于vfun2位于VTABLE的第二個(gè)位置,相當于 VPTR+1,每個(gè)函數指針是4個(gè)字節長(cháng),所以最后的調用被編譯器翻譯為 jmp DWORD PTR [eax+4]。如果是調用pBase->vfun1(),這句就該被編譯為jmp DWORD PTR [eax]。
評論