深入理解计算机系统(1.3)------操作系统的抽象概念

  上一篇博客我们讲解了存储设备的层次结构,并详细讲解了高速缓存的原理,以及可以利用高速缓存来提高程序性能。如果对Java Web 熟悉的,我们可以理解高速缓存类似Web 端的缓存机制。那么这一篇博客我们来引出并谈谈操作系统的抽象概念。

1、操作系统

  首先接着来讨论 hello world 程序的例子。当外壳加载和运行 hello 程序,以及 hello 程序输出自己的消息时,外壳和 hello 程序都没有直接访问键盘、显示器、磁盘或者主存。取而代之的是,它们依靠操作系统提供服务。

  那么什么是操作系统呢?我们可以把操作系统看成应用程序和硬件之间插入的一层软件,如下图:

  如图可知:所有的应用程序对硬件的操作都必须通过操作系统。常见的操作系统比如windows、Unix、Linux等等。

  操作系统的两个基本功能:

  ①、防止硬件被失控的应用程序滥用。

  ②、向应用程序提供简单一致的机制来控制复杂而又大相径庭的低级硬件设备。

  我们可以通过进程、虚拟存储器和文件这几个抽象概念来实现上面两个功能。

   如上图:文件是对I/O设备的抽象表示,虚拟存储器是对主存和磁盘I/O设备的抽象表示,进程则是对处理器、主存和I/O设备的抽象表示。下面我们分别对其进行介绍。

2、进程

   当我们去运行 hello 程序的时候,操作系统会给我提供一种假象,就好像系统只有这个程序在运行。处理器看上去就像在不间断的一条接着一条地执行程序中的命令,即该程序的代码和数据是系统存储器中唯一的对象。

  这其实是一种假象,而这种假象是通过进程的概念来实现的。

  进程是操作系统对一个正在运行的程序的一种抽象,在一个系统上可以运行多个进程,而每个进程都好像在独占的使用硬件。但实际上,他们是并发的在运行,即一个进程的指令和另一个进程的指令是交错运行的。

  在单CPU系统中,系统在一个时刻只能运行一个进程,多CPU系统中,系统则是能够同时处理多个进程。但无论是单核还是多核,一个CPU只能并发的执行多个进程,这是通过处理器在进程间切换来实现的。而操作系统实现这种交错机制称为上下文切换。

  上下文:操作系统保持跟踪进程运行所需的所有状态信息,比如PC和寄存器文件的当前值,主存的内容。

  比如上面的A进程是外壳进程,B进程是hello进程。起初只有外壳进程在运行,即等待命令行上的输入,当我们输入相关命令让它运行hello程序时,外壳通过调用一个专门的函数,即系统调用,来执行我们的请求,系统会将控制权传递给操作系统。操作系统保存外壳程序的上下文,创建一个新的 hello 进程以及上下文,然后将控制权传递给新的 hello 进程。hello 进程终止后,操作系统恢复外壳进程的上下文,并将控制权回传给它,外壳程序将继续等待下一个命令行输入。

  实现进程这种抽象概念需要低级硬件和操作系统软件之间的紧密合作,这个实现原理以及应用程序如何创建和控制它们的进程的呢?作为程序员的角度,这里我们讲一下,一个进程实际上是由多个称为线程的执行单位构成,每个线程都运行在进程的上下文中,并共享同样的代码和全局数据,多线程比进程高效,多线程更容易共享数据。如何并发编程提高程序效率的要点后面我们会详细讲解。

3、虚拟存储器 

   虚拟存储器是一个抽象概念,它为每个进程提供了假象,即每个进程都在独占的使用主存。每个进程看到的是一致的存储器,称为虚拟地址空间。下图是 Linux 进程的虚拟地址空间(其他Unix 系统设计类似):

  在Linux系统中,地址空间最上面的区域是为操作系统中的代码和数据保留的,这对所有进程是一致的。地址空间的底部区域存放用户进程定义的代码和数据。上图的地址从下往上是增大的。

  我们从最低的地址,逐步向上介绍上面出现的区域名词。

  ①、程序代码和数据:对于所有进程来说,代码是从同一固定地址开始的,分别为0x08048000(32位)以及0x00400000(64位),紧接着是全局变量相对应的数据位置。

  ②、堆:代码和数据区后紧随的是运行时堆。代码和数据区是在进程一开始运行时就规定了大小,而当调用malloc和free这样的 C 标准库函数 时,堆可以在运行时动态的扩展和收缩。

  ③、共享库:存放像C标准库和数据库这样的代码和数据的区域。

  ④、栈:位于用户虚拟地址空间顶部,编译器用它来实现函数调用,用户栈在程序执行期间可以动态的扩展和收缩。当我们调用一个函数时,栈会增长;从一个函数返回时,栈会收缩。

  ⑤、内核虚拟存储器:内核总是驻留在内存中,是操作系统的一部分,不允许应用程序读写这个区域的内容或者直接调用内核代码定义的函数。

   关于所有进程代码是从同一固定地址开始的,这里我们做个验证,我们在 Linux 64位系统上,在存放hello.c程序的目录下输入如下命令:运行前面写好的 hello.c 程序,并查看地址信息

gcc -Wl,--verbose hello.c

4、文件

  文件就是字节序列,即由值0和值1组成的序列。所有的I/O设备,包括磁盘、键盘、鼠标、显示器都可以看成是文件。

  文件这个简单而精致的概念向应用程序提供了一个统一的视觉来看待系统中所有的I/O设备。这带来的好处显而易见,比如同一个程序可以使用不同磁盘技术的不同系统运行。

5、计算机系统中抽象的重要性

  抽象的使用是计算机科学中最重要的概念之一。例如,为一组函数规定一个简单的应用程序接口API就是一个很好的编程习惯。程序员无需了解它内部的工作原理便可以使用这些代码。这在Java当中的典型比如类的定义,C语言中的函数原型。

6、本章总结

  本章主要介绍了抽象概念在计算机系统中的重要性以及操作系统的抽象概念,包括进程、虚拟存储器以及文件。

  那么深入理解计算机系统第一章计算机系统的漫游将到此结束。如果又不太理解的也没关系,毕竟前面讲的都是一些概念,后面我们将会详细讲解。而下一章信息的表示和处理,可能是与我们日常编码最相近的东西,各种数据类型在计算机总是如何存储,它们之间做运算会有什么意想不到的结果等等。如果好好理解了,相信在后面的编码会更加得心应手。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏田京昆的专栏

Memcached 与 Redis 实现的对比

memcached 和 redis,作为近些年最常用的缓存服务器,相信大家对它们再熟悉不过了。前两年还在学校时,我曾经读过它们的主要源码,如今写篇笔记从个人角度...

32.2K15
来自专栏Spark学习技巧

必会:关于SparkStreaming checkpoint那些事儿

spark Streaming的checkpoint是一个利器,帮助在driver端非代码逻辑错误导致的driver应用失败重启,比如网络,jvm等,当然也仅限...

582
来自专栏Java Edge

操作系统之存储管理一、基本概念:地址重定位二、地址重定位三、物理内存管理四、连续内存管理方案五、离散内存管理方案(重点)六、交换技术七、虚拟存储技术八、页表及页表项的设计三、虚拟页式存储中软件相关策略

2978
来自专栏技术分享

Redis 数据结构与内存管理策略(下)

Redis 数据结构与内存管理策略(下) 标签: Redis Redis数据结构 Redis内存管理策略 Redis数据类型 Redis类型映射 作者:王清培...

2838
来自专栏芋道源码1024

注册中心 Eureka 源码解析 —— 网络通信

本文主要分享 Eureka 的网络通信部分。在不考虑 Eureka 2.x 的兼容的情况下,Eureka 1.x 主要两部分的网络通信:

732
来自专栏大内老A

[WCF-Discovery]服务如何能被”发现”

要让作为服务消费者的客户端能够动态地发现可用的服务,首先的要求服务本身具有可被发现的特性。那么到底一个可被发现的服务和一个一般的服务有何不同呢?或者说如何让一个...

1709
来自专栏互联网技术杂谈

beanstalkc Tutorial 中文版

英文原版:https://github.com/earl/beanstalkc/blob/wip-doc-rtfd/doc/tutorial.rst

2808
来自专栏码神联盟

Java常见缓存机制cache(集成spring使用)

今天我们首先来总结下cache,一步步消化,消化完了cache,然后在总结redis,冰冻三尺非一日之寒,技术亦如此。 1理解cache 在Ja...

3156
来自专栏木可大大

漫谈计算机体系

人类为什么要发明计算机?一直以来,人类都有爱偷懒的习惯,而正是由于这个原因,促使了人类发明了计算机,从而提高生产力,那么人类有了更多空闲时间去娱乐了~~

1.4K24
来自专栏一枝花算不算浪漫

[Redis]Redis 概述及基本使用规范.

3808

扫码关注云+社区