逆向知识第七讲,三目运算符在汇编中的表现形式,以及编译器优化方式

                  逆向知识第七讲,三目运算符在汇编中的表现形式

一丶编译器优化方式

首先说一下编译器优化方式.

1.常量折叠

2.常量传播

3.复写传播

4.公共表达式

5.去掉不可达到分支

6.顺序代替分支

7.数学变化

8.代码外提

9.减少变量.

10 强度削弱.

优化方式解析

1.常量折叠

  常量折叠已经讲过, 就是两个常量相加  8 + 8 ,那么在编译前期就能计算出来.

2.常量传播

  当一个变量,没有对齐进行写入或者更改的时候,这个时候可以当做常量.(优化为常量)

3.复写传播

  这个需要好好说说了,我们都知道,C语言中,C调用约定都需要平栈.比如你调用完毕一个printf,那么就需要平栈.

     而优化的时候,直接一起平栈了.

就比如:

  int i = (a * a + b);

  int j = i * 5;

那么此时可以变成  int j = (a * a + b) * 5 ;这样就会省掉一个变量(当然和去除变量不一样)

call addr

add esp,8

call  addr

add esp,8

此时汇编代码可以变成

call addr 

call addr

add esp,16   这样就省掉了一个add 指令了.

4.公共表达式

公共表达式和复写传播有点不一样.(看着是相反的.但是不能说是相反的.)

比如 int i = (a *a * b) * 7;

  int j = (a * a * b) * 7 * 3

优化之后变成.

int j = i * 3;

什么是公共表达式,就是说,表达式用的都是一样的.重复使用,这样的时候,可以使用变量来存着了.或者中专一个寄存器保存其结果.

这样效率会很快,不用重新计算了.

5.去掉不可达到分支

这个应该很好理解.

if(1)
{
    ......
}
else
{
    .....  
}

此时if语句会成立,而else永远不会成立,那么编译器优化的时候就可以去掉else语句了.

6.顺序代替分支

这个下方讲解三木运算符的时候可以明白.

7.数学变化

这也很好理解.

3a + 5a

那么此时可以变为一条表达式计算直接变成8a

8.代码外提

也很好理解.

for (int i = 0; i < (argc / 3);i++)
{
            
    ..............
    //中间没有使用argc变量  
}

中间没有使用argc变量.

那么此时优化的时候,可能会用寄存器,也或者会用一个局部变量保存  (argc / 3)

int j = (argc / 3);

那么此时for循环的条件变成了  i < j即可.

这样就不用每次循环一遍就计算一遍(argc / 3)了.

9.减少变量.

定义的变量没有使用,优化的时候自然就会消失了.(减少空间)

10 强度削弱.

很好理解.我们都知道除法的指令周期很长.所以前边讲解除法的时候各种套路,各种数学定理各种公式.

目的是什么,目的就是为了让指令周期缩短一点.

强度削弱指的就是,当时用高指令周期的指令的时候,可不可以使用低指令周期完成高指令周期做的事情.

比如说:

  一个DIV指令是100指令周期(当然你可以想象成100秒)

那么一个移位是10个指令周期

此时我计算  一个公式  n  / 4;

那么可以变成

mov eax,[ebp - xxx]

sar  eax,2

也完成了DIV的作用.  如果看做是100秒时间,那么我们只用了10^n秒(n的取值看上面的指令,比如mov,占4个指令周期,举个例子,那么合起来才14个指令周期)

二丶三木运算符在汇编中的表现形式

高级代码:

#include "stdafx.h"
#include "MyClass.h"

int main(int argc, char* argv[])
{
    unsigned int nVar_4 = 5;
    scanf("%d", &nVar_4);
    printf("%d\r\n", argc == 0 ? 0 : -1);              第一种表达方式,判读为零还是为1的情况
    
    printf("%d\r\n", argc > 9 ? argc*nVar_4 : nVar_4/argc);   第二种表达方式,无法优化的表达方式.
    
    printf("%d\r\n", argc == 9 ? 35 : 98);             第三种表达方式,利用0和-1来运算
    printf("%d\r\n", argc >= 9 ? 35 : 98);             第四种表达方式,指令支持
}

1.三木运算符第一种表达形式.

有用的汇编代码就4行.

1.变量给寄存器保存.

2.寄存器内容求补码

3.带进位的减法.

首先说下什么意思.

这里是无分支三木运算

neg的意思就是求补, 但是运算的时候是 ecx = 0 - ecx值.

neg只有 0 - 0的时候才不会借位. 

还原代码要从三方面考虑

为零的情况下

为零的时候,neg 一下,那么其结果还是 0,CF位没有借位.

还原代码为:

if(argc == 0)
{
     ecx  = 0;  
}

为负数的时候:

如果为负数的时候,那么

neg一下,其结果是 0 - 负数 (CF借位,则置位1)

sbb  负数- 负数 -  CF   结果是-1

还原代码为:

if(argc < 0)
{
    ecx = -1;
  
}

为正数的情况下

如果是正数

neg一下  0 - 正数 = 负数, 那么CF借位了,其结果是1

sbb一下.  负数- 负数 - CF   其结果是 -1  (负数- 负数= 0,0 - CF(1) = -1)

还原代码:

if(argc > 0)
{
   ecx == -1;  
}

总结上面方面情况还原得出其还原代码为.

if(argc < 0) ecx = -1;
if(argc ==0) ecx = 0;
if(argc > 0) ecx = -1;

如果转化为三木运算符,这个就看自己爱怎么转化了

比如:

  argc ==0 ? 0 : -1

a ?  b :c 以后分为a b c讲解,a代表表达式和条件 ,b和C代表其结果.

其中,这种优化方式,则是顺序优化.也就是上面没说的.结果之后有一方成立

2.三木运算符的第二种表达方式

 高级代码:

printf("%d\r\n", argc > 9 ? argc*nVar_4 : nVar_4/argc);

这个代码,无法优化,因为不知道变量是多少.看下汇编代码把.

这个很简单了.

1.局部变量给寄存器保存.

2.和9比较

3.小于怎么怎么做

4.大于怎么怎么做.

3.三木运算符的高级汇编表示,利用0和-1

高级代码:

printf("%d\r\n", argc == 9 ? 35 : 98);

对应汇编代码:

这个汇编代码要分为两部分看,三部分代入.

1.相等的情况下怎么走

2.大于的时候怎么走

3.小于的时候怎么走.

1.相等的时候怎么走(属于代入)

看第一部分代码:

看上面汇编代码解析

这里的esi是argc变量,因为上下文关系,所以变量的值已经在esi保存了。

现在我们带入走汇编指令

当esi == 9的时候

第二句   sub edx,9  (结果为0)

第三句   neg edx    (0 - 0 还是0)

第四句   sbb edx,edx (0 - 0 - CF, 此时因为neg所以CF = 0 所以就是 0 - 0 - 0 还是0

接着看下方第二部分代码

为零的时候,edx 走到and之后,还是0

然后接着add 那么其结果是23h

由此还原汇编代码:

if(argc == 9) edx = 23h

2.大于的时候怎么走

还是同上

1.如果> 9,那么 sub后结果是正数

2.neg之后. 0 - 正数= 负数  (0 - 正数的时候,借位了,所以CF位是1)

3.sbb 之后 负数- 负数 = 0, 然后- CF位 = -1;

4.如果是-1,那么and之后其结果是3FH

5.接着add之后其结果是 (3fh + 23h)

还原代码:

if (argc > 9) edx = (3fh + 23h)

3.小于的时候怎么走

1.sub之后, 结果为负数

2.neg之后( 0 - 负数 = 取负数的绝对值(负负得正),有借位,所以CF = 1)

3.sbb 之后, 正数- 正数 - CF = 正数- 正数 - 1 = -1;

4.结果为-1,那么and起作用

5,执行add,加23h

还原代码:

if (argc < 9) edx = (0c1h + 23h)

综上条件,换成三目运算其结果是:

if(argc < 9) edx = 3fh + 23h
if(argc ==9)edx = 23h
if(argc > 9) edx = (3fh + 23h)

那么可以还原成:

  argc == 9 ? 23h : 62h

注意这里的3Fh,这里的3Fh,是 c - b (如果条件取反,那么则是b-c)的结果.

四丶指令支持版本

高级代码:

printf("%d\r\n", argc >= 9 ? 35 : 98);

汇编代码: 

image.png

注意,

esi还是 argc的值

这里出现了新的指令 setl指令,这属于set系列

和条件跳转指令一样

比如 jns jle(小于等于) jge(大于等于) ....

这里setl l代表小的意思也就是小于

那么就很简单了.

1.局部变量和9比较

2.如果小于9,则al设置为1

3.dec相减,结果为0

4.根据0和非0的值去and,如果为零,则 and al 0c1h则没用

5.最后add即可.

也是三部分代入,这里和上面类似.我直接代入还原代码.

但是需要注意,这里是如果小于则会设置al,那么就是小于的时候会走一个,而大于或者等于,其结果有不一样.

小于的情况下:

  1.和9比较

  2.小于9,al设置为1

  3.dec eax, 1 - 1 = 0;结果为零.

  4.为零,那么and执行之后还是0

  5.执行add

还原代码:

  根据上面得知,小于9 会执行 add

if(argc < 9) reg32 = 62h

大于或者等于的情况下.

1.和9比较,大于9

2.大于9,则al不设置,结果为0

3.dec eax, 0 - 1 = -1,其结果变成-1,也就是FFFFFFFF

4.结果为-1,则and成立,其结果变为0C1H

5.add eax,62 紧接着加上其结果

还原代码

if(argc >=9) reg32 = (c1 + 62h)注意这里会进位的.

综上所述,可以得出:

if(argc < 9) reg32 = 62h if(argc >= 9)reg32 = (0c1h + 62h);

(0c1h + 62)然后看结果,后八位(因为我们是32位系统)其结果是35

还原三目运算符为:

argc >= 9 ? 35:98

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏前端菜鸟变老鸟

特定场景下的数据格式化(根据后台控制格式化的方式)

1313
来自专栏Pythonista

python中的函数

初中数学函数定义:一般的,在一个变化过程中,如果有两个变量x和y,并且对于x的每一个确定的值,y都有唯一确定的值与其对应,那么我们就把x称为自变量,把y称为因变...

1354
来自专栏SDNLAB

【一课专栏】解构2 - 明察YangInstanceIdentifier

屈原《离骚》中云:“路漫漫其修远兮,吾将上下而求索”,其实,学习软件编程,学习SDN技术也是一个路漫漫,上下求索的过程。

2342
来自专栏机器学习和数学

[编程经验]python2和python3的区别总结

最近涨粉涨的厉害啊,那天看刚破800,今天打开又有32个新粉丝,有点开心,哈哈哈。说实话,看的人多的话,是我坚持下去最大的动力。。。 = = = print("...

2954
来自专栏生信宝典

Python学习教程(三)

函数操作 函数是重用的程序段。它们允许你给一块语句一个名称,然后你可以在你的程序的任何地方使用这个名称任意多次地运行这个语句块。这被称为 调用 函数。我们已经使...

2129
来自专栏Java技术栈

深度历险:Redis 内存模型详解

Redis 是目前最火爆的内存数据库之一,通过在内存中读写数据,大大提高了读写速度,可以说 Redis 是实现网站高并发不可或缺的一部分。

1782
来自专栏web前端教室

javascript 红皮高程(18)-- 布尔操作符

可算是把绕来绕去的二进制-位操作符,给学完了。至少我学到了十之八九,你呢,,, 接下来是布尔操作符,它一共有三个,非(NOT),与(AND),或(OR)。 1,...

1969
来自专栏逆向技术

框架原理第二讲,RTTI,运行时类型识别.(以MFC框架讲解)

           框架原理第二讲,RTTI,运行时类型识别.(以MFC框架讲解) 一丶什么是RTTI,以及RTTI怎么设计 通过第一讲,我们知道了怎么样升成...

20810
来自专栏Fundebug

ES6之Spread Operater拷贝对象

1234
来自专栏吾爱乐享

short s=1;s=s+1; short s=1;s+=1; 有区别么?? 如果有的话区别是什么?

1483

扫码关注云+社区

领取腾讯云代金券