深入理解计算机系统（3.3）---数据传送（或者说复制）指令详解

YGingko

发布于 2018-09-30 11:30:56

7350

发布于 2018-09-30 11:30:56

文章被收录于专栏：海说海说

引言

　　上一章我们已经介绍了汇编语言的基础部分，包括数据格式、寄存器以及操作数的标识方式，接下来我们就应该去认识一下汇编语言当中的各个指令了。这些指令大多数都非常简单，但是组合在一起却能模拟出我们程序当中想要的任何效果，确实是十分神奇的一件事。

数据传送指令

　　数据传送指令的目的是为了将一个数据从一个位置复制到另外一个位置。既然如此，那么数据传送指令就会包含一个源操作数和一个目的操作数，指令会将原操作数的值复制到目的操作数并覆盖。

　　数据传送指令一共可分为五种，分别是mov、movs、movz、push以及pop，下面LZ依次介绍一下这五个指令的作用。

mov指令

　　mov指令的作用是将源操作数S中的数据复制到目的操作数D中，mov指令有一个数据格式和两个操作数，因此一般的形式为[movx S D]。其中x为数据格式，S为源操作数，D为目的操作数。

　　这里举一个简单的例子，比如我们有一条指令为movl %edx %eax。那么它的执行过程就如下图所示。

　　可以看到，在指令执行之后，%edx寄存器当中的内容会被复制到%eax寄存器。需要一提的是，mov指令可以在后面加上任何数据格式，比如上面这一过程中，数据格式则为四个字节，也就是双字。因此不难推断出，我们还可以使用movb和movw去复制一个字节或者两个字节。

movs指令

　　movs指令的作用是将源操作数S中的数据做符号扩展后，再复制到目的操作数D中，movs指令有两个数据格式和两个操作数，因此一般的形式为[movsxy S D]。其中x、y为数据格式，S为源操作数，D为目的操作数。其中x、y的组合一共有三种，分别是bw、bl、wl，这三个组合代表的意思分别是单字节到双字节，单字节到双字以及双字节到双字。

　　这里LZ依然举一个例子，对于指令movswl %dx %eax来讲，它的作用如下图所示。

　　这里为了可以看出符号位的扩展，因此LZ这里使用了十六进制的整数表示方式。可以看到，movs指令将0x8FFF扩展以后存入%eax寄存器，其中%dx为寄存器%edx的后16位表示。

movz指令

　　movz指令的作用是将源操作数S做零扩展后，再复制到目的操作数中。它与movs指令十分相似，也有两个数据格式和两个操作数，因此一般的形式为[movzxy S D]。其中x、y为数据格式，S为源操作数，D为目的操作数。其中x、y的组合一共有三种，分别是bw、bl、wl，这三个组合代表的意思分别是单字节到双字节，单字节到双字以及双字节到双字。

　　这里依然采用相似的示例，我们来看看对于指令movzwl %dx %eax来讲，它的作用与上面的movs有何不同。

　　可以看出，movz与movs指令是十分相似的，只是这里扩展后，目标寄存器%eax的前16位为0而不再是1。

push指令

　　push指令与上面的mov族指令有着不同，它的目的操作数被固定为栈顶，因此它的指令当中没有目的操作数。另外有一点需要注意的是，它在进行复制操作之前，需要移动栈顶指针（-4）。push指令的一般形式为[pushl S]，其中l代表数据格式为双字，S为源操作数，目的操作数默认为栈顶。

　　这里LZ举一个简单的例子，比如pushl %edx这条命令，它的任务是将%edx寄存器的值复制到栈顶。我们首先来看一下命令执行前，寄存器以及存储器的状态。

　　可以看到，寄存器%ebp和%esp分别指向帧指针和栈指针，而%esp实际上就是指向的栈顶。由于现在栈顶位于-16的位置，因此若要将%edx压入栈，则先需要将栈顶移动到-20的位置，然后再进行复制，移动后的状态如下图所示。

　　可以看到，这里栈指针的位置已经发生了变化，向下移动了四位，并且将%edx寄存器的值放入新的栈顶，因此pushl %edx指令就相当于下面两条指令。

　　　　　　　　　　　　　　　　　　subl $4,%esp

　　　　　　　　　　　　　　　　　　movl %edx,(%esp)

　　这里可以看出来，其实pushl指令做了一个隐藏操作，就是移动栈指针（-4），这一点希望各位猿友们注意。

pop指令

　　pop指令与push指令是做的相反的操作，一个是入栈一个是出栈。对于pop指令来讲，它的源操作数被固定为栈顶，相反，它会先进行复制操作，然后再移动栈指针。pop指令的一般形式为[popl D]，其中l代表数据格式为双字，D为目的操作数，源操作数默认为栈顶。

　　接下来我们举一个例子，与上面的例子类似，我们考虑popl %edx这条指令的效果，它会将栈顶的值弹出到寄存器%edx。首先来看执行之前，寄存器以及存储器的状态。

　　接下来执行pop指令时，会先将栈顶的值复制到%edx，然后再将栈指针移动（+4）。我们来看一下它执行后的状态。

　　可以看到，之前栈顶的内容已经被弹出到%edx寄存器，并且当前栈顶已经移动到了-16的位置，也就是进行了+4操作。因此popl %edx指令就相当于下面两条指令。

　　　　　　　　　　　　　　　　　　movl (%esp),%edx

　　　　　　　　　　　　　　　　　　addl $4,%esp　　　　　

　　这里可以看出来，其实popl指令也同样做了一个隐藏操作，就是移动栈指针（+4）。

数据复制示例

　　上面我们已经了解了几乎所有的数据复制指令，接下来我们写一小段程序，来看下这些数据复制指令，如何完成我们的程序操作。

simple(int *xp,int y){
    int t = *xp;
    *xp=y;
    return t;
}

　　上面是一个简单的C程序sum.c，它其中包含了一些赋值操作，我们来看看它的汇编代码。使用GCC -O1 -S sum.c来获取我们的汇编代码，并使用cat sum.s来查看一下。

    .file    "sum.c"
    .text
.globl simple
    .type    simple, @function
simple:
    pushl    %ebp
    movl    %esp, %ebp
    //以上为栈的建立部分
    movl    8(%ebp), %edx
    movl    (%edx), %eax
    movl    12(%ebp), %ecx
    movl    %ecx, (%edx)
    //以下为栈的完成部分
    popl    %ebp
    ret
    .size    simple, .-simple
    .ident    "GCC: (Ubuntu 4.4.3-4ubuntu5.1) 4.4.3"
    .section    .note.GNU-stack,"",@progbits

　　分析这段汇编代码的时候，我们应该分为三个部分来看待，首先是栈的建立、然后是使用、最后是完成部分。可以看到，里面几乎全是数据复制指令，我们先来看看栈的建立部分。

　　其实对于一开始pushl和movl指令来讲，它主要做了两件事。第一个是将原来的帧指针备份到栈顶，然后再将帧指针和栈指针统一指向这个新的栈顶，也就是完成了一个新栈的建立。它在完成后，栈的状态如下所示。