版权声明:本文为博主原创文章,未经博主允许不得转载。 https://cloud.tencent.com/developer/article/1344433
在x86里,条件跳转的指令有:
JMP:无条件跳转
JAE/JNB:大于或等于跳转,用于无符号整数运算
JA/JNBE:不小于或不等于跳转,用于无符号整数运算
JB/JNAE:小于跳转,用于无符号整数运算
JBE/JNA:小于或等于跳转,用于无符号整数运算
JG/JNLE:大于跳转,用于有符号整数运算
JGE/JNL:大于或等于跳转,用于有符号整数运算
JL/JNGE :小于跳转,用于有符号整数运算
JLE/JNG:小于或等于跳转,用于有符号整数运算
JE/JZ:等于跳转
JNE/JNZ:不等于跳转
JC:有进位跳转
JNC:无进位跳转
JNO:不溢出跳转
JNP/JPO:奇偶性为奇数跳转
JNS:符号位为 "0"跳转
JO:溢出跳转
JP/JPE:奇偶性为偶数跳转
JS:符号位为 "1" 跳转
上面这些指令,大多会检测EFLAGS寄存器相应的标志位来再决定是否跳转。而这些指令之前,往往会有一些设置这些标志位的指令。最常见的是cmp, test指令。那么,就可以根据上面指令快速构建条件结构的骨架。
下面通过例子来验证一下,由于在C/C++里,条件语句有if…elseif…else和switch两种,所以在例子会对两者都有探究。
先看一下例子:
#include <stdio.h>
int cond_if( int a, int b, int c )
{
if ( a == 0 )
{
return b + c;
}
else if ( a > 0 )
{
return b - c;
}
else
{
return b*c;
}
}
int cond_switch( int a, int b, int c )
{
switch( a )
{
case 0:
return b + c;
case 1:
return b - c;
default:
return b*c;
}
}
int main()
{
int a = 0, b = 0, c = 0;
scanf( "%d,%d,%d", &a, &b,&c );
return cond_if( a,b,c ) + cond_switch( a, b, c );
}
先看一下cond_if的汇编:
(gdb) disassemble cond_if
Dump of assembler code for function _Z7cond_ifiii:
0x08048570 <+0>: push %ebp
0x08048571 <+1>: mov %esp,%ebp
0x08048573 <+3>: cmpl $0x0,0x8(%ebp)
0x08048577 <+7>: jne 0x8048583 <_Z7cond_ifiii+19>
0x08048579 <+9>: mov 0x10(%ebp),%eax
0x0804857c <+12>: mov 0xc(%ebp),%edx
0x0804857f <+15>: add %edx,%eax
0x08048581 <+17>: jmp 0x804859e <_Z7cond_ifiii+46>
0x08048583 <+19>: cmpl $0x0,0x8(%ebp)
0x08048587 <+23>: jle 0x8048597 <_Z7cond_ifiii+39>
0x08048589 <+25>: mov 0x10(%ebp),%eax
0x0804858c <+28>: mov 0xc(%ebp),%edx
0x0804858f <+31>: mov %edx,%ecx
0x08048591 <+33>: sub %eax,%ecx
0x08048593 <+35>: mov %ecx,%eax
0x08048595 <+37>: jmp 0x804859e <_Z7cond_ifiii+46>
0x08048597 <+39>: mov 0xc(%ebp),%eax
0x0804859a <+42>: imul 0x10(%ebp),%eax
0x0804859e <+46>: pop %ebp
0x0804859f <+47>: ret
End of assembler dump.
由
0x08048573 <+3>: cmpl $0x0,0x8(%ebp)
0x08048577 <+7>: jne 0x8048583 <_Z7cond_ifiii+19>
可知,这是判断cond_if的第一个参数a,是否等于0。如果不等于则跳转。那么,
0x08048579 <+9>: mov 0x10(%ebp),%eax
0x0804857c <+12>: mov 0xc(%ebp),%edx
0x0804857f <+15>: add %edx,%eax
应该对应a等于0时要执行的语句,即
7 return b + c;
由
0x08048583 <+19>: cmpl $0x0,0x8(%ebp)
0x08048587 <+23>: jle 0x8048597 <_Z7cond_ifiii+39>
可知,这是判断a是否小于等于0,如果是则跳转。那么,
0x08048589 <+25>: mov 0x10(%ebp),%eax
0x0804858c <+28>: mov 0xc(%ebp),%edx
0x0804858f <+31>: mov %edx,%ecx
0x08048591 <+33>: sub %eax,%ecx
0x08048593 <+35>: mov %ecx,%eax
应该对于a大于0的语句,即
11 return b - c;
同时由
0x08048583 <+19>: cmpl $0x0,0x8(%ebp)
0x08048587 <+23>: jle 0x8048597 <_Z7cond_ifiii+39>
可知, 0x08048597开始的指令是对应a小于0的情况,即
0x08048597 <+39>: mov 0xc(%ebp),%eax
0x0804859a <+42>: imul 0x10(%ebp),%eax
对应于
15 return b*c;
再看一下cond_switch的汇编:
(gdb) disassemble cond_switch
Dump of assembler code for function _Z11cond_switchiii:
0x080485a0 <+0>: push %ebp
0x080485a1 <+1>: mov %esp,%ebp
0x080485a3 <+3>: mov 0x8(%ebp),%eax
0x080485a6 <+6>: test %eax,%eax
0x080485a8 <+8>: je 0x80485b1 <_Z11cond_switchiii+17>
0x080485aa <+10>: cmp $0x1,%eax
0x080485ad <+13>: je 0x80485bb <_Z11cond_switchiii+27>
0x080485af <+15>: jmp 0x80485c9 <_Z11cond_switchiii+41>
0x080485b1 <+17>: mov 0x10(%ebp),%eax
0x080485b4 <+20>: mov 0xc(%ebp),%edx
0x080485b7 <+23>: add %edx,%eax
0x080485b9 <+25>: jmp 0x80485d0 <_Z11cond_switchiii+48>
0x080485bb <+27>: mov 0x10(%ebp),%eax
0x080485be <+30>: mov 0xc(%ebp),%edx
0x080485c1 <+33>: mov %edx,%ecx
0x080485c3 <+35>: sub %eax,%ecx
0x080485c5 <+37>: mov %ecx,%eax
0x080485c7 <+39>: jmp 0x80485d0 <_Z11cond_switchiii+48>
0x080485c9 <+41>: mov 0xc(%ebp),%eax
0x080485cc <+44>: imul 0x10(%ebp),%eax
0x080485d0 <+48>: pop %ebp
0x080485d1 <+49>: ret
End of assembler dump.
由
0x080485a6 <+6>: test %eax,%eax
0x080485a8 <+8>: je 0x80485b1 <_Z11cond_switchiii+17>
可知,0x080485b1到0x080485b9这一段代码是属于参数a为0的情况(eax的值是从8(%ebp)即a得来的),所以,
0x080485b1 <+17>: mov 0x10(%ebp),%eax
0x080485b4 <+20>: mov 0xc(%ebp),%edx
0x080485b7 <+23>: add %edx,%eax
对应于
24 return b + c;
由
0x080485aa <+10>: cmp $0x1,%eax
0x080485ad <+13>: je 0x80485bb <_Z11cond_switchiii+27>
可知,0x080485bb到0x080485c7是对应于a为1的情况,所以,
0x080485bb <+27>: mov 0x10(%ebp),%eax
0x080485be <+30>: mov 0xc(%ebp),%edx
0x080485c1 <+33>: mov %edx,%ecx
0x080485c3 <+35>: sub %eax,%ecx
0x080485c5 <+37>: mov %ecx,%eax
对应
26 return b - c;
而
0x080485c9 <+41>: mov 0xc(%ebp),%eax
0x080485cc <+44>: imul 0x10(%ebp),%eax
是由
0x080485af <+15>: jmp 0x80485c9 <_Z11cond_switchiii+41>
跳转的,0x080485af是判断完a不为0,1之后才会执行的,所以这段汇编对应于
28 return b*c;
从上面来看,通过对跳转语句进行分析,能够很快还原代码原先的逻辑,也很容易定位到哪一行代码。也可以看到,if…else if…else和switch实际上在汇编里是没什么区别。