前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >16位汇编语言第二讲系统调用原理,以及各个寄存器详解

16位汇编语言第二讲系统调用原理,以及各个寄存器详解

作者头像
IBinary
发布2017-12-28 14:12:37
1K0
发布2017-12-28 14:12:37
举报
文章被收录于专栏:逆向技术逆向技术

   16位汇编语言第二讲系统调用原理,以及各个寄存器详解

昨天已将简单的写了一下汇编代码,并且执行了第一个显示到屏幕的helloworld

问题?

  helloworld怎么显示出来了.

一丶显卡,显存的概念

1.显示hello就要操作显示器,这是非常原始的,那个时候的程序员,并没有像现在的RGB(红绿蓝)这样的三色真彩色,那个时候就是操作显卡的,定义了一个标准

这个标准就是我们要往固定的地址写入数据,就会显示出来

具体流程

操作显卡 -> 显卡有自己的缓存 -> 把数据写入到显存中, - > 显示数据 (显示到屏幕上)

但是那个时候是没有字的,所以就开始造字,那个时候就是把英文的26的英文字母做出来颜色都是一样的

比如 我们造一个1,并且把它放到显存中

0 0 1 0 0

0 0 1 0 0   把这个1看做是一个二维数组,把这块数据放到显存中就会显示1了.

0 0 1 0 0 

二丶锯齿的概念

我们发现,很多游戏中都有一个选项,叫做坑锯齿

其实锯齿是因为,以前做 1的时候,颜色就是黑白的 这样的字就有一点点的齿痕.看着不舒服,所以后边,就用三色,把和一个字相同颜色的都放在一起

这样看的字就很平滑,很好看.

可以看出,我写了一个 1字,放大后旁边的像素有蓝色的,红色的黄色的等等,而以前的就是黑色一种,所以看着很难看.

三丶系统调用原理

比如我们想显示一个字符串,直接 "hello"双引号包含起来,给操作系统即可.就会显示了.

那么原理是什么.

  第一讲中,说了一个指令字典,里面有功能号 int 21代表我们要调用那一项,而硬件是提供了一个表格,调用的时候直接查表

这个表格是函数指针数组,直接调用即可.

例如

但是我们会想,操作系统会调用这第21项显示数据,那么这个表可能是无限的大的吗,而操作系统提供的api就要好几万个,怎么一个表够用吗

所以后面有了ah寄存器传参,上面的图可以改为

当然可能不用Switch这种低效率的语法,会做优化,但是原理就是这样,硬件厂商只提供指令,就是说我cpu一定会调用int 21指定,找到数组中的第21项

而 这个表格则是操作系统提供的.

所以现在就知道,什么是 int 21,和为什么ah给9才能显示字符串了吧.

四丶新的问题系统没有启动之前就会显示字符串

我们有没有发现,系统还没有启动之前,就会显示一段字符串,这个字符串是通过主板的bios显示的

bios是不依赖于系统的,优先于系统存在.

操作系统启动之后也可以调用

在指令字典中 

 在中断码中会有说,调用int 多少,参数通过什么寄存器给.等等. 他和cpu的那种表是不一样的,但是都存在于操作系统启动之前.

五丶寄存器详解

1.IP指令寄存器

IP寄存器,上一讲说过,IP寄存器适合CS段寄存器一起使用的,IP是偏移(ip寄存器叫做指令寄存器) 他是表示通过cs段寄存器 + IP的偏移,来确定下一条指令执行的位置

比如我们有一段汇编代码

下一条指令执行的执行的位置是0100 ip就等于0100,可以用p指令查看. 其实ip等于0100是代表ip的偏移是0100,用cs段寄存器 * 16 + ip的偏移,就等于实际物理地址(也就是下一条指定指令的位置)也就是 mov ax,1

p指令调试查看

第一次

第一指令位置的偏移是0103 也就是 mov bx,2会开始执行,下面一次类推(不懂段寄存器,下面细讲)

2.Flag标志寄存器

标志寄存器的好的博客简介连接  https://my.oschina.net/clownfish/blog/142328

上一讲也说了flag标志寄存器释放各种标志的, flag标志器是16位

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

0

OF

DF

IF

TF

SF

ZF

AF

PF

CF

通常标志器是9个,常用的有6个,不常用的有三个,说下不常用的吧 DF IF TF,其余就是常用的了

CF 进位标志( Carry Flag) :
当我们做加法运算的时候,比如两数相加 结果是否进位了

进位的时候,标志就是1,否则标志就是0,如果是加法运算,那么标志位1代表进位,如果为减法,那么标志为借位

比如 3AH + 7CH = B6H (h在汇编中代表前边的数字是16进制) 没有进位CF = 0

AAH + 7CH = (1) 26H,最高位进位了,CF = 1

ZF 零标志(Zero Flag):
表示你运算的结果为0,则ZF = 1,如果不为零则ZF = 0

例子:  

  3AH + 7CH = B6H,结果不为零,ZF = 0

  84H + 7CH = (1) 00H,结果是0,因为进位了,那么CF = 1

SF 符号标志位(sign flag):

表示运算的结果,最高位为1,则SF为1,否则最高位不为1 SF = 0

3AH + 7CH = B6H,结果的最高位不为零,以为B看做二进制的则是 1 0 1 1 最高位是1所以 SF = 1

84H + 7CH = (1) 00H,结果是0,最高位是0

PF 奇偶标志位 (Parity Flag)

表示你运算的结果中,统计1出现的个数(二进制的统计)如果1的个数为零,或者偶数的时候,则PF = 1,奇数则是0

比如

3AH + 7CH = B6H, = 1011 0110 B(后缀B代表二进制的意思) 统计个数,出现了五个1则PF = 0;

 OF 溢出标志位(OverFlow Flag)

若运算结果有溢出(或者结果不正确)则OF = 1,否则OF = 1

比如

3AH + 7CH = B6H 产生了溢出, OF = 1

AAH + 7CH = (1) 26H,进位了,但是没有溢出,OF = 0

1.溢出

  在8位表达的整数返回的时候 是+127 -> -128

  在16位表达的范围内是: +32767~ -32768

  比如 3AH + 7CH = B6H,在八位范围中 3A = 10进制的58 7C = 十进制的124 

  那么结果就是58 + 124 = 182,远远超过了128的范围,所以产生了一出,并一方面

  B6H的结果变成补码,其值就是-74,显然结果也是不正确的

2.溢出和进位的不同

  溢出标志OF,和进位标志CF是不同的,

极为标志表示无符号数运算的记过是否超出范围,其运算结果仍然正确

溢出标志表示有符号数的运算结果是否超出了范围,运算的结果已经是不正确了.

3.如何运用溢出和进位

这个取决于程序员

当处理器对两个操作数进行运算的时候,会按照无符号的数据求得结果(为什么是无符号,因为负数有补码)

并且设置进位标志位CF,同事,根据是否超出有符号数的范围设置一处标志OF,也就是说也会设置进位,也会设置溢出标志位,设置溢出标志位的原因是无符号数已经超过了范围了.

利用那个标志取决于程序员自己决定

 4.溢出的原理判断

简而言之就是 正数加正数等于正数,但是此时结果的二进制最高位为1(1是负数的意思)那么计算机就认为产生了一出

AF 辅助进位标志(Auxiliary Carry Flag)

辅助标志位主要表示的是低4个的进位或者借位,和CF不同,CF是八位产生进位和借位才会设置标志位

所以这个为辅助进位标志位

比如:

3AH + 7CH = B6H,低四位有进位,则AF = 1

DF 方向标志位(Direction Flag)

比如我们的SI 和DI 变址寄存器如果要memcpy的时候,内存会增加或者减少.

DF就是控制地址的变化的方向的

DF = 0,则存储器地址自动增加

DF = 1,则存储器的地址自动减少

汇编中的CLD指令,表示复位方向标志,让其DF = 0,地址自动增加

汇编中的STD指令,表示置位方向标志,DF = 1,表示地址曾东减少.

IF 中断允许标志(Interrupt - enable Flag)

官方语言: 用于控制外部可屏蔽中断是否可以被处理器响应

自己理解的

比如键盘按下,怎么知道按下的,以前是无限循环,但是效率特别低,现在改成了键盘按下就会像CPU发送一个信号

CPU正在执行指令的时候,你按了一下键盘,会先放弃当前指令,去执行键盘发送过来的按键指令,但是如果我们一直按着键盘不放,是不是当前的指令就执行不了了,所以我们设置标志即可屏蔽当前发送过来的指令

汇编指令 CLI指令复位中断标志IF = 0;

汇编指令 STI指令置为中断标志: IF = 1

IF = 1,则代表我们可以允许中断(也就是屏蔽指令)

IF = 0,则IF 禁止中断

TF 陷阱标志(Trap Flag)

用于控制处理器进入单步操作方式(一般调试器才会用到)

TF = 0,处理器正常工作

TF = 1,处理器单步执行指令

利用这个标志,可以对程序进行逐条指令的调试.

这种逐条指令的调试程序的方法就是单步调试,

没有汇编指令,如果设置,则用 位运算 | 上即可.

 二丶段寄存器以及存储器

1.存储器和段寄存器

简而言之

  说的就是寄存器是cpu内部的内存

  内存可以存放外部数据

  硬盘可以存放外部数据,断电后还会存在

2.数据的表达单位

  二进制 bit 0 1 组成

  字节 byte 8个bit位组成

  字 word 16位 : 2个字节组成

  双字DWord 32位,两个字组成

分为大端模式存储,和端模式存储

官方语言是 LSB,MSB等等.小尾方式,和大尾方式

大端模式:  低位放低位地址,高位放到高位地址

低地址 - -------- 高地址 (比如存放1 2 3 4)

0x1  0x2   0x3  0x4

小端模式

低位放高地址,高位放低地址

低地址 - -------- 高地址 (比如存放1 2 3 4)

0x4 0x3 0x2 0x1

3.存储单元和存储内容

 每个存储单元都有一个地址编号,被称为存储器的地址,在C语言中其实就是内存地址

每个存储单元都存放了一个字节的内容.

如果取内容则是

[地址] = 取出来的值,所以C语言中的数组的中括号就是这样来的.

 4.解决CP的寻址能力

16位处理器,能处理最大的数据范围是2^16次方数据,也就是64k,就算你装上一个1MB的内存也访问不到

解决:

  1.8086CPU有20条地址线,最大的可寻址的控件是2 ^20次方,威力地址从00000h - FFFFFh

  2.8086CPU讲1MB的空间分为了很多逻辑段(Segment)

    每个段的最大限制为64kb,为什么,因为寄存器是16位了,没次寻址都是2 ^16次方

    短地址的低四位为0000b,为什么,因为加了4根地址总线,也就是多了4个,所以都给4

 这样,一个存储单元,除了有一个唯一的物理地址,还有很多的逻辑地址

现在为了解决这个寻址问题,所以用2个寄存器存储,也就是上面为什么说CS和IP一起来确定一条物理内存执行

的下一条指令了.

而逻辑地址有很多,分了好几段,也就是段地址了, 采用段基地址 : 段内偏移地址 这样存储

段地址: 段地址就是逻辑地址在主存的起始位置

  8086规定段的地址必须是%16, 那么地址就是xxxx0H,因为是16进制,所以最后为0,换算成二进制就是后面4个二进制为0

  因为%16地址,所以现在就能用16位的段寄存器来表示段地址了.

偏移地址

  偏移地址说明主存单元距离段地址起始位置的偏移量

  每段也是不超过64kb,也可以用寄存器存储,所以 IP就出现了

 物理地址和逻辑地址的转换

讲逻辑地址(段地址)左移4位(也就是 *2^4次方)加上偏移的地址,就得到了20位的物理地址

一个物理地址可以有多个逻辑地址

比如

逻辑地址 1460 : 100 物理地址就是14600 (因为*16) + 上偏移100 = 14700H

1380: F00  = 13800 + F00 = 14700H

 8086中常用的段寄存器

 CS(代码段) 指定代码段的起始地址

SS (堆栈段) 指明了对斩断的起始地址

DS (数据段) 指明了数据段的起始地址

ES(附加段) 指明了附加端的起始地址

而这些在C语言中称为内存4区

为什么分段:

  我们上一讲写的显示Helloworld并且写到文件中,现在汇编的代码和数据是在一起的,但是一旦程序更大了,就不好弄了.

作业: 使用debug编译器,利用指令,查看标志位的状态显示分别是什么

第二讲作业以及工具获取连接

链接:http://pan.baidu.com/s/1mi3KW1U 密码:0u0e

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017-08-29 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  •    16位汇编语言第二讲系统调用原理,以及各个寄存器详解
    • 一丶显卡,显存的概念
      • 二丶锯齿的概念
        • 三丶系统调用原理
          • 四丶新的问题系统没有启动之前就会显示字符串
            • 五丶寄存器详解
              • 1.IP指令寄存器
              • 2.Flag标志寄存器
          •  二丶段寄存器以及存储器
            •  8086中常用的段寄存器
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档