专栏首页原创分享进程的执行和挂起

进程的执行和挂起

1 进程总览

进程是对逻辑的抽象,我们从操作系统的书籍中对进程有了很多的认识,但是对进程的实现可能不太了解,这篇文章尝试解释一下关于进程实现的大致原理。 进程的实现,其实和我们平时写代码的时候一样,比如我们要表示一个东西,我们会定义一个数据结构。进程也不例外。所以进程的本质就是一个数据结构,他保存了一系列的数据。操作系统以数组或者链表的形式和全部的进程管理起来。进程可以说分为两种 1 系统初始化时第一个进程, 2 除了第一个进程外的其他进程,他们都是由fork或者fork+execute系统调用创建出来的。 我们首先看一下进程的结构体都有什么信息。

在这里插入图片描述 以上就是表示进程的结构体中主要的信息。那么一个结构体就是表示一个进程。我们知道fork是以父进程为模块,复制一份父进程的结构体,然后修改某些字段。就变成了一个新的进程。如果调用execute的话,就是进一步修改复制出来的结构体中的字段(比如页表、代码段、数据段)。并且从硬盘加载相应的数据到内存。那么第一个进程是如何产生的呢?因为进程只是一个结构体,所以如果我们预定义了一个结构体,那么就可以不通过fork的形式创建一个进程了。

2 进程的执行

当系统创建一个进程之后,会设置cs:ip寄存器的值,如果是fork,则ip就是fork函数后面的语句的ip地址。如果是execute则ip地址由编译器指定。不管怎样,当进程开始执行的时候,cpu就会解析cs:ip拿到一条指令去执行。那么cs:ip是如何被解析的呢? 执行进程的时候,tss选择子(GDT索引)被加载到tss寄存器,然后把tss里的上下文也加载到对应的寄存器,比如cr3,ldt选择子。根据tss信息中的ldt索引首先从GDT找到进程ldt结构体数据的首地址,然后根据当前段的属性,比如代码段,则从cs中取得选择子,系统从ldt表中取得进程线性空间的首地址、限长、权限等信息。用线性地址的首地址加上ip中的偏移,得到线性地址,然后再通过页目录和页表得到物理地址,物理地址还没有分配则进行缺页异常等处理。

3 进程的挂起和唤醒

进程的挂起、阻塞、多进程。这些概念我们平时听得比较多,现在我们来看看他是实现是怎样的。进程的挂起,或者说阻塞分为两种。 1 主动挂起。通过sleep让进程间歇性挂起。sleep的原理之前有分析过,就不再分析。大概的原理

  • 就是设置一个定时器,到期后唤醒进程。
  • 修改进程为挂起状态,等待唤醒。

2 被动挂起。 被动挂起的场景比较多,主要是进程申请一个资源,但是资源没有满足条件,则进程被操作系统挂起。比如我们读一个管道的时候。管道没有数据可读,则进程被挂起。插入到管道的等待队列。

在这里插入图片描述 当管道有内容写入的时候,进程被唤醒。进程被挂起(分为可被信号唤醒和不能被信号唤醒两种)和唤醒的实现。

// 当前进程挂载到睡眠队列p中,p指向队列头指针的地址
void sleep_on(struct task_struct **p)
{
    struct task_struct *tmp;

    if (!p)
        return;
    if (current == &(init_task.task))
        panic("task[0] trying to sleep");
    /*
        *p为第一个睡眠节点的地址,即tmp指向第一个睡眠节点
        头指针指向当前进程,这个版本的实现没有采用真正链表的形式,
        他通过每个进程在栈中的临时变量形成一个链表,每个睡眠的进程,
        在栈里有一个变量指向后面一个睡眠节点,然后把链表的头指针指向当前进程,
        然后切换到其他进程执行,当被wake_up唤醒的时候,wake_up会唤醒链表的第一个
        睡眠节点,因为第一个节点里保存了后面一个节点的地址,所以他唤醒后面一个节点,
        后面一个节点以此类推,从而把整个链表的节点唤醒,这里的实现类似nginx的filter,
        即每个模块保存后面一个节点的地址,然后把全局指针指向自己。
    */
    tmp = *p;
    *p = current;
    // 不可中断睡眠只能通过wake_up唤醒,即使有信号也无法唤醒
    current->state = TASK_UNINTERRUPTIBLE;
    // 进程调度
    schedule();
    // 唤醒后面一个节点
    if (tmp)
        tmp->state=0;
}

// 唤醒队列中的第一个节点,并清空链表,因为第一个节点会向后唤醒其他节点
void wake_up(struct task_struct **p)
{
    if (p && *p) {
        (**p).state=0;
        *p=NULL;
    }
}

我们发现,进程的实现,和我们平时写代码差不多,就是定义数据结构,然后实现操作数据结构的算法。当然,因为涉及到硬件底层,操作系统的实现比我们的代码复杂得多。时间有限,先说这么多。

本文分享自微信公众号 - 编程杂技(theanarkh),作者:theanarkh

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-03-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 通过linux0.11理解僵尸进程

    首先僵尸进程产生的原因是子进程退出了,但是父进程没有回收他的资源(pcb),所以我们从源头开始分析这个过程。那就是子进程退出的时候。进程是通过exit系统调用退...

    theanarkh
  • 理解进程的新建和执行过程

    本文以linux0.11版本为基础,分析进程的内存布局,现代版本已经发生比较大的变化,都是很多原理都是类似的。 系统维护了一个全局的数据结构叫GDT( Glob...

    theanarkh
  • 理解进程和线程

    进程和线程是操作系统里很重要的概念,但是所有的东西都会落实到代码。看起来很复杂的进程线程,其实在操作系统的代码里。也只是一些数据结构和算法。只不过他比一...

    theanarkh
  • 【nodejs原理&源码赏析(4)】深度剖析cluster模块源码与node.js多进程(上)

    cluster模块是node.js中用于实现和管理多进程的模块。常规的node.js应用程序是单线程单进程的,这也意味着它很难充分利用服务器多核CPU的性能,而...

    大史不说话
  • [linux] C语言Linux系统编程进程基本概念

    1.如果说文件是unix系统最重要的抽象概念,那么进程仅次于文件。进程是执行中的目标代码:活动的、生存的、运行的程序。

    陶士涵
  • Linux进程基础

      计算机实际上可以做的事情实质上非常简单,比如计算两个数的和,再比如在内存中寻找到某个地址等等。这些最基础的计算机动作被称为指令(instruction)。所...

    用户6754675
  • Linux僵尸进程

    版权声明:本文为博主原创文章,转载请注明博客地址: https://blog.csdn.ne...

    zy010101
  • 从CPU管理到进程的引入

    为什么要管理CPU,这是因为在“上古时代”,CPU是计算机硬件之中最昂贵的资源。因此提高CPU利用率是很有必要的。我们知道只要给CPU的PC一个地址,CPU就能...

    zy010101
  • UNIX环境高级编程笔记之进程控制

      本章重点介绍了进程控制的几个函数:fork、exec族、_exit、wait和waitpid等,主要需要掌握的是父进程和子进程之间的运行机制,怎么处理进程的...

    CloudDeveloper
  • 僵尸进程

      在每个进程退出的时候,内核释放该进程所有的资源,包括打开的文件,占用的内存等.但是仍然为其保留一定的信息(包括进程号the process ID,退出状态t...

    猿人谷

扫码关注云+社区

领取腾讯云代金券