从汇编看c++中默认构造函数的使用分析

2016-02-19 09:54 11 1 收藏

下面是个从汇编看c++中默认构造函数的使用分析教程，撑握了其技术要点，学起来就简单多了。赶紧跟着图老师小编一起来看看吧！

【 tulaoshi.com - 编程语言】

c++中的源程序:
代码如下：

class X {
private:
int i;
};

int main() {
X x;
}

上面的类X没有定义构造函数，仅仅有一个int i。

下面为其汇编程序：
代码如下：

; 7 : int main() {

    push    ebp;ebp为一个寄存器，总是指向一个函数调用堆栈的栈底，作为基址，用偏移量来访问该调用栈上的变量，但这里没有任何变量要访问，因此不起作用
    mov    ebp, esp;这两句的作用是为了保存调用main之前堆栈的基址ebp的值，并将ebp指向main调用栈的栈底
    push    ecx;将寄存器ecx的值压栈, 栈顶指针esp向前移动4byte
               ;这句的作用，为即将要创建的对象预留了4byte的空间，并向里面写入ecx的值

; 8 : X x;
; 9 : }

    xor    eax, eax;eax也是一个寄存器，这里不起作用
    mov    esp, ebp;将栈顶指针移动到push ecx前的位置，即释放了4byte的空间
    pop    ebp;恢复基址到main调用之前的状态
    ret    0;函数返回

通过汇编发现，通过push ecx，编译器将堆栈栈顶移动4byte，并将寄存器的ecx的值写入，类X只含有一个int，大小刚好为4byte，因此这一句可以看成是为对象x分配空间。而接下来并没有任何函数的调用，来对这一块区域进行适当的初始化。所以，在没有明确定义一个构造函数的时候，不会有任何的初始化操作。

下面再看一段c++程序:
代码如下：

class X {
private:
int i;
int j;//增加一个成员变量int j
};

int main() {
X x;
}

与上面相比，在类X里面增加了一个成员变量int j，类的大小变为8字节。

下面为对应汇编码:
代码如下：

; 8 : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 8; 栈顶指针移动8byte，刚好等于类X的大小

; 9 : X x;
; 10 : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0

从汇编码看出，通过sub esp，8指令，堆栈确实留出了8byte的空间，刚好等于类X的大小，同样没有调用任何函数，来进行初始化操作。

所以，综上所述，在一个类没有明确定义构造函数的时候，编译器不会有任何的函数调用来进行初始化操作，仅仅是移动栈顶留出对象所需空间，也就是说，这种情况下，编译器根本不会提供默认的构造函数。

那么，书上说的由编译器提供默认的构造函数到底是怎么一回事呢？

下面看第一种情况，类里面有虚成员函数:

c++源码如下:
代码如下：

class X {
private:
    int i;
    int j;//增加一个成员变量int j
public:
    virtual ~X() {

    }
};

int main() {
X x;
}

析构函数为虚函数

下面是main函数对应的汇编码:
代码如下：

; 13 : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 12                    ; 为对象x预留12byte的空间，成员变量int i，int j占8byte，由于有虚函数，因此vptr指针占4byte

; 14 : X x;

lea ecx, DWORD PTR _x$[ebp];获取x对象的首地址，存入ecx寄存器
call ??0X@@QAE@XZ;这里调用x的构造函数

; 15 : }

    lea    ecx, DWORD PTR _x$[ebp];获取对象x的首地址
    call    ??1X@@UAE@XZ                ; 调用析构函数
    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0

可以看到，对象x的构造函数被调用了，编译器确实合成了默认的构造函数。

下面是构造函数的汇编码:
代码如下：

??0X@@QAE@XZ PROC                    ; X::X, COMDAT
; _this$ = ecx
    push    ebp
    mov    ebp, esp
    push    ecx
    mov    DWORD PTR _this$[ebp], ecx;ecx寄存器存有对象x的首地址
    mov    eax, DWORD PTR _this$[ebp];将对象x的首地址给寄存器eax
    mov    DWORD PTR [eax], OFFSET ??_7X@@6B@;这里设置vptr指针的值，指向vtable (OFFSET ??_7X@@6B@是获得vtable的地址)
                                          ;并且通过这句，也可以证明vptr指针位于对象其实地址处
    mov    eax, DWORD PTR _this$[ebp]
    mov    esp, ebp
    pop    ebp
    ret    0

可以看到，由于有虚函数，涉及到多态，因此构函数初始化了vptr指针，但是没有为另外两个变量int i，int j赋值。

从上面可以看出，类里面含有虚函数时，在没有明确定义构造函数时，编译器确实会为我们提供一个默认的构造函数。因此当一个类继承自虚基类时，也满足上面的情形。

接下来是第二种情形，类Y继承自类X，X明确定义了一个默认的构造函数(并非编译器提供),而类Y不定义任何构造函数:

先来看看c++源码:
代码如下：

class X {
private:
    int i;
    int j;
public:
    X() {//X显示定义的默认构造函数
        i = 0;
        j = 1;
    }
};

class Y : public X{//Y继承自X
private:
int i;
};

int main() {
Y y;
}

类Y里面没有显示定义任何构造函数

下面是main函数对应的汇编码:
代码如下：

; 19 : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 12                    ; 为对象y预留12byte空间，y自身成员变量int i占4byte 父类中的成员变量int i int j占8byte

; 20 : Y y;

lea ecx, DWORD PTR _y$[ebp];获取对象y的首地址，存入寄存器ecx
call ??0Y@@QAE@XZ;调用对象y的构造函数

; 21 : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0

main函数中调用了由编译器提供的默认y对象的默认构造函数。

下面是编译器提供的y对象默认构造函数的汇编码:
代码如下：

??0Y@@QAE@XZ PROC                    ; Y::Y, COMDAT
; _this$ = ecx
    push    ebp
    mov    ebp, esp
    push    ecx
    mov    DWORD PTR _this$[ebp], ecx;ecx中存有对象y的首地址
    mov    ecx, DWORD PTR _this$[ebp]
    call    ??0X@@QAE@XZ                ; 调用父类X的构造函数
    mov    eax, DWORD PTR _this$[ebp]
    mov    esp, ebp
    pop    ebp
    ret    0
??0Y@@QAE@XZ ENDP

可以看到y对象的构造函数又调用了父类的构造函数来初始化继承自父类的成员变量，但自身成员变量依然没有初始化。

下面是父类X的构造函数汇编码:
代码如下：

; 7 : X() {

    push    ebp
    mov    ebp, esp
    push    ecx
    mov    DWORD PTR _this$[ebp], ecx; ecx中存有对象y的首地址

; 8 : i = 0;

mov eax, DWORD PTR _this$[ebp];对象y首地址给寄存器eax
mov DWORD PTR [eax], 0;初始化父类中的变量i

; 9 : j = 1;

    mov    ecx, DWORD PTR _this$[ebp];对象y首地址给寄存器ecx
    mov    DWORD PTR [ecx+4], 1;初始化父类中的变量j,在对象y的内存空间中，从首地址开始的8比特用来存储继承自父对象的成员变量，后4byte用来存储自己的成员变量
                            ;由于首地址存储了父类成员变量i，因此内存地址要从对象y的首地址要移动4byte，才能找到父类成员变量j所处位置

; 10 : }

    mov    eax, DWORD PTR _this$[ebp]
    mov    esp, ebp
    pop    ebp
    ret    0

可以看到，y对象继承自父类的成员变量由父类构造函数初始化。父对象包含在子对象中，并且this指针，即寄存器ecx存储的首地址始终是子对象y的首地址。

如果父类X中也没有定义任何构造函数会怎样？

下面是c++源码:
代码如下：

class X {
private:
int i;
int j;

};

class Y : public X{//Y继承自X
private:
int i;
};

int main() {
Y y;
}

父类和子类都没有任何构造函数。

下面是main函数汇编码:
代码如下：

; 16 : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 12                    ; 和刚才一样，为对象y预留12byte

; 17 : Y y;
; 18 : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0

可以看到main中根本没有任何函数的调用，也就是说，编译器没有为子对象y提供默认构造函数。

那么，要是父类中带参数的构造函数，而子类中没有构造函数呢?这时候编译器会报错。

下面看第三种情况，类Y中包含成员对象X，成员对象有显示定义的默认构造函数，而类Y没有任何构造函数:

先看c++源码:
代码如下：

; 16 : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 12                    ; 和刚才一样，为对象y预留12byte

; 17 : Y y;
; 18 : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0

类X为类Y的成员对象
下面是main函数的汇编码:
代码如下：

; 21   : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 12                    ; 为对象y预留12byte 成员对象的变量占8byte 对象y自身占变量占4byte 成员对象包含在对象y中

; 22 : Y y;

lea ecx, DWORD PTR _y$[ebp];对象y的首地址存入ecx
call ??0Y@@QAE@XZ;调用对象y的构造函数，由编译器提供的默认构造函数

; 23 : }

xor eax, eax
mov esp, ebp

pop ebp
ret 0

对象y的构造函数被调用，即编译器提供了默认的构造函数

对象y的构造函数汇编码:
代码如下：

??0Y@@QAE@XZ PROC                    ; Y::Y, COMDAT
; _this$ = ecx
    push    ebp
    mov    ebp, esp
    push    ecx
    mov    DWORD PTR _this$[ebp], ecx;ecx中存有对象y的首地址
    mov    ecx, DWORD PTR _this$[ebp]
    add    ecx, 4;加4是因为对象y首地址起始处存储的是自身成员变量i
    call    ??0X@@QAE@XZ                ; 调用成员对象x的构造函数
    mov    eax, DWORD PTR _this$[ebp]
    mov    esp, ebp
    pop    ebp
    ret    0

对象y的构造函数调用了成员对象x的构造函数，用来初始化成员对象中的成员变量，对象y自身的成员变量没有初始化。

成员对象x的构造函数汇编码:
代码如下：

??0X@@QAE@XZ PROC ; X::X, COMDAT
; _this$ = ecx

; 7 : X() {

    push    ebp
    mov    ebp, esp
    push    ecx
    mov    DWORD PTR _this$[ebp], ecx;ecx中存有成员对象x的起始地址

; 8 : i = 0;

mov eax, DWORD PTR _this$[ebp];成员对象x的起始地址给eax寄存器
mov DWORD PTR [eax], 0;初始化成员对象x中额成员变量i

; 9 : j = 0;

mov ecx, DWORD PTR _this$[ebp];成员对象x的起始地址给ecx寄存器
mov DWORD PTR [ecx+4], 0;初始化成员对象x中额成员变量j 加4的原因是j的地址偏离了成员对象x起始地址4byte(即成员对象x的成员变量i的字节数)

; 10 : }

    mov    eax, DWORD PTR _this$[ebp]
    mov    esp, ebp
    pop    ebp
    ret    0

但是，如果成员对象x也没有任何构造函数，情形会怎样呢?

下面是c++源码:
代码如下：

class X {
private:
int i;
int j;

};

class Y {
private:
int i;
X x;//x成员对象
};

int main() {
Y y;
}

下面是main函数汇编码:
代码如下：

; 17 : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 12                    ; 为对象预留12byte空间

; 18 : Y y;
; 19 : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0

可以看到，main函数里面没有任何函数调用，也就是说编译器没有提供默认构造函数。

那要是成员对象x有带参数的构造函数(即非默认构造函数)，而对象y没有任何构造函数呢？此时，编译器会报错。

这种情形和前一种情形很相似。

综合以上的情况，可以总结出，对于一个类不含任何构造函数，而编译器会提供默认的构造函数，有一下3种情形:

1 类本身函数虚成员函数或者继承自虚基类

2 类的基类有构造函数，并且基类构造函数还是显示定义的默认构造函数(非编译器提供),若基类的构造函数带有参数(即非默认构造函数),编译器报错

3 这种情况和上一种相似，类的成员对象有构造函数，并且成员对象的构造函数还是显示定义的默认构造函数(非编译器提供);若成员对象的构造函数带有参数(即非默认构造函数),编译器报错。

以上参考了《VC++深入详解》里面的知识点，还有自己的分析，欢迎指正

来源:http://www.tulaoshi.com/n/20160219/1592625.html

上一篇：深入详解C编写Windows服务程序的五个步骤
下一篇：用javascript实现的图片马赛克后显示并切换加文字功能

看过《从汇编看c++中默认构造函数的使用分析》的人还看了以下文章更多>>

C++中函数指针数组的使用

标签：编程语言网络编程

笔者在开发某软件过程中碰到这样一个问题，前级模块传给我二进制数据，输入参数为 char* buffer和 int length，buffer是数据的首地址，length表示这批数据的长度。数据的特点是：长度不定，类型不定，由第一个字节（buffer[0]）标识该数据的类型，共有256（28 ）种可能性。我的任务是必须对每一种可能出现的数据类型都要作处理，并且我的模块包...

C++类对象的复制－拷贝构造函数

标签：编程语言网络编程

在学习这一章内容前我们已经学习过了类的构造函数和析构函数的相关知识，对于普通类型的对象来说，他们之间的复制是很简单的，例如： int a = 10; int b =a; !-- frame contents -- !-- /frame contents -- 自己定义的类的对象同样是对象，谁也不能阻止我们用以下的方式进行复制,例如：#include iostream&n...

C++/CLI思辨录之代理构造函数

标签：编程语言网络编程

现在我们讨论一下新的C++/CLI环境下的一个很酷的特性，称作代理构造函数。对一个类来说，有多个构造函数是经常的事；并且这多个构造函数有一段共同的代码也很经常。一般地，在这种情况下，我们都是为该共同代码段编写一个独立的函数，然后放在每个构造器中调用。如下例： class Foo { private: int _mem; public: Foo(...

在Visual C++中使用内联汇编

标签： C语言教程 C语言函数

因为在Visual C++中使用内联汇编不需要额外的编译器和联接器，且可以处理Visual C++中不能处理的一些事情，而且可以使用在C/C++中的变量，所以非常方便。内联汇编主要用于如下场合: 1.使用汇编语言写函数； 2.对速度要求非常高的代码； 3.设备驱动程序中直接访问硬件； 4."Naked" Call的初始化和结束代码。 /...

C/C++中函数指针的含义

标签：编程语言网络编程

函数存放在内存的代码区域内，它们同样有地址，我们如何能获得函数的地址呢？假如我们有一个int test(int a)的函数，那么，它的地址就是函数的名字，这一点如同数组一样，数组的名字就是数组的起始地址。 !-- frame contents -- !-- /frame contents -- 定义一个指向函数的指针用如下的形式，以上面的test()为例： ...

查看更多精彩>>