C++ 虚函数表图文解析
作者:flight1111
一、前言
一直以来,对虚函数的理解仅仅是,在父类中定义虚函数,子类中可以重写该虚函数,并且父类指针可以指向子类对象,调用子类的虚函数(多态)。在读研阶段经历的几个项目中,自己所写的类中并没有用到虚函数,对虚函数这个东西的强大之处并没有太多体会。最近,学了设计模式中的简单工厂模式,对多态有了具体的认识。于是,补了补多态、虚函数、虚函数表相关的知识,参考相关博客,加上自己的理解,整理了这篇博文。
二、含有虚函数类的内存模型
以下面的类为例(32位平台下):
class Father { public: virtual void fun1() { cout << "Father::fun1()" << endl; } virtual void fun2() { cout << "Father::fun2()" << endl; } int i; };
该类中含有两个虚函数和一个成员变量i,输出sizeof(Father),结果为8个字节。如果去掉virtual关键字,则结果为4个字节。也就是说,类中含有虚函数,则该类会增加4个字节,那这4个字节是什么变量所占据的呢?
答案是一个指针(我觉得应该是unsigned int*类型指针,这点不确定),在vs调试窗口中,可以看到该指针名为_vfptr,该指针称为虚函数表指针。
类的内存模型如下,_vptr指针和成员变量i各占4字节,一共8字节。另外 ,-vptr指针一定在内存模型前面。对于只有一个虚表指针的类来说,类内存模型前4个字节就是虚表指针所占空间。
三、虚函数表与虚函数表指针
上面提到_vfptr是虚函数表指针,那虚函数表是什么呢?
虚函数表其实就是一个指针数组
,这个数组中存放着虚函数的地址,大概如下:
最后一个类似于字符串的结束标志位,VS编译器中为0。
这样的话,虚函数表指针就很容易理解了,这个虚函数表指针指向该虚函数表,也就是虚函数指针的值就是上述指针数组的首地址。
四、虚函数地址
函数存放在代码区,虚函数也不例外。虚函数表中存放的是虚函数地址,即代码区虚函数的入口地址。
五、多态
定义一个Father的子类Son,对虚函数fun1()进行重写。
#include<iostream> using namespace std; class Father { public: virtual void fun1() { cout << "Father::fun1()" << endl; } virtual void fun2() { cout << "Father::fun2()" << endl; } int i; }; class Son :public Father { virtual void fun1() { cout << "Son::fun1()" << endl; } }; int main() { Son son; Father father; Father *p = &father; p->fun1(); p->fun2(); p=&son; p->fun1(); p->fun2(); return 0; }
父类中有虚函数,则子类同样会有一个虚函数指针,这个指针指向一个新表,如下图所示:
Son类重写了fun1(),未重写fun2(),那么虚函数表中,第一个地址便是重写的Son::fun1()的地址,第二个地址仍然是父类中Father::fun2()的地址。这里可以在vs调试模式下,查看father与son的虚函数表,son表中第二个元素值与father表中第二个元素值相同。
Father *p = &father; p->fun1(); p->fun2();
p指向Father对象father:
p->fun1():沿着框1->框3->框5
的路径,调用Father::fun1();
p->fun2():沿着框1->框4->框6
的路径,调用Father::fun2();
p=&son; p->fun1(); p->fun2();
p指向子类对象son:
p->fun1():沿着框7->框9->框11
的路径,调用Son::fun1();
p->fun2():沿着框7->框10->框6
的路径,调用Father::fun2();
六、通过函数指针操作调用虚函数
现修改main函数
typedef void(*Fun)(void); int main() { Father father; Son son; printf("虚函数表地址_vfptr:%p\n", *(unsigned int*)(&father)); printf("第一个虚函数地址e:%p\n", *(unsigned int*)*(unsigned int*)(&father)); printf("第二个虚函数地址f:%p\n", *((unsigned int*)*(unsigned int*)(&father)+1)); unsigned char* end = NULL; end = (unsigned char*)((unsigned int*)*(unsigned int*)(&father) + 2); printf("结束符地址d:%p\n", end); printf("结束符值:%d\n", *end); Fun pFun = NULL; pFun = (Fun)(*((unsigned int*)*(unsigned int*)(&father) + 1)); pFun(); return 0; }
运行结果:
先看一下vs调试模式下各变量的值
将之前的图修改一下,便于理解:
红框中,father中的_vfptr为0x1270234,对应上图中的_vfptr,即虚函数表的地址;
数组[0]值为0x01261447,对应上图中的e,即Father::fun1()的地址;
数组[1]值为0x0126141a,对应上图中的f,即Father::fun2()的地址。
好了,现在来看一下程序中这些看起来很唬人的东西:
printf("虚函数表地址_vfptr:%p\n", *(unsigned int*)(&father)); printf("第一个虚函数地址e:%p\n", *(unsigned int*)*(unsigned int*)(&father)); printf("第二个虚函数地址f:%p\n", *((unsigned int*)*(unsigned int*)(&father)+1)); unsigned char* end = NULL; end = (unsigned char*)((unsigned int*)*(unsigned int*)(&father) + 2);
这里,直接用上图中的符号进行分析,否则,说一通xx的地址、对xx解引用等等,容易把人搞晕。
(1)
虚函数表的地址*(unsigned int*)(&father)
- a0=&father
- a1=(unsigned int *)a0
- _vfptr=*a1
注意,这里a0和a1的数值是一样的,但只有把地址a0强制转换成(unsigned int *)类型,解引用时系统才会从该地址向后解析4个字节空间,解析成一个unsinged int类型数据。
(2)
第一个虚函数地址*(unsigned int*)*(unsigned int*)(&father)
- b=(unsigned int*)_vfptr
- e=*b
(3)
第二个虚函数地址*((unsigned int*)*(unsigned int*)(&father)+1)
- c=b+1
- f=*c
(4)
结束符地址(unsigned char*)((unsigned int*)*(unsigned int*)(&father) + 2)
- 未强制转换的d=b+2
- 强制转换的d=(unsigned char*)(b+2)
(5)
通过函数指针调用虚函数
Fun pFun = NULL; pFun = (Fun)(*((unsigned int*)*(unsigned int*)(&father) + 1)); pFun();
七、结语
这篇博文包含许多自己理解的内容,并在此基础上画了图解,如果有误,还请指正。
八、参考
到此这篇关于C++ 虚函数表图文解析的文章就介绍到这了,更多相关C++ 虚函数表内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!