前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【Linux】进程理解与学习(Ⅱ)

【Linux】进程理解与学习(Ⅱ)

作者头像
诺诺的包包
发布2023-03-15 08:59:50
5810
发布2023-03-15 08:59:50
举报
文章被收录于专栏:个人笔记总结

环境:centos7.6,腾讯云服务器 Linux文章都放在了专栏:【 Linux 🌹undefined 相关文章推荐:Linux】冯.诺依曼体系结构与操作系统 Linux】进程理解与学习(Ⅰ) 谈Linux下的shell--BASH


前言

章节介绍

在前文中我们已经了解了进程的相关概念,明白了 OS管理进程实际上就是对进程对应的task_struct/pcb做相关操作,但是实际上系统中存在的进程有很多,我们可以输入指令 ps -lA查看当前系统下的所有进程。而OS为了更高效的对进程进行管理,不会对每个进程都面面俱到,而是会将进程分为 不同的状态( 这就好像OS为了更好的管理内存,会将内存划分为不同的分区,每个分区存放各自对应的数据类型,比如栈区存放一些局部变量、静态区存放全局变量等)从而来进行 更好的管理

本次章节目标就是对进程的不同状态做相关介绍与深入了解

ps -lA查看系统下的所有进程(部分)

阻塞与挂起

阻塞

在了解进程状态之前,我们先来谈一谈阻塞与挂起的两个概念。所谓阻塞,就是指进程因为等待某种资源就绪,而导致的一种不推进状态。也就是我们常说的卡住了。

🔺这里简单举个例子

  • 就好比我们在下载一些东西时假如突然断网,那我们的下载是不是就停住了,然后等网络资源恢复后才可以继续进行下载。而这个停住的过程,就是阻塞。实际上本质来说就是pcb此时本应被cpu调度,执行下载,但是因为网络资源突然断开,此时pcb就会到网络资源对应的pcb队列中排队等待,等到网络资源就绪,并且排到它时,它才会继续回到运行队列排队,然后等待被cpu调度,继续下载。

分析图

当然,为了更直观的看到这种现象,我们可以看下面这张图

分析图2

挂起

  • 挂起本质也是一种特殊的阻塞,挂起是一种什么情况呢?我们前文已经了解了,进程=内核数据结构(pcb)+进程的代码与数据。而挂起实际上是指:该进程的pcb没有被cpu调度,然后占用了内存空间,此时OS会将该进程的数据与代码放到磁盘中暂存,等pcb被调度时,再将代码和数据预加载到内存。

★简单总结

  • 进程的pcb可以被维护在不同的队列
  • 阻塞:进程因为等待某种资源,而导致的不推进状态(pcb会到某种资源的等待队列下排队,等资源就绪时再被维护到运行队列,等待调度)
  • cpu的调度一般是一种线性调度(当然也存在因为进程优先级而导致的插队情况,后面会讲)
  • 挂起是一种特殊的阻塞,pcb不被cpu调度,os会将数据与代码暂存在磁盘,等pcb进入运行队列等待调度时,再将数据与代码预加载到内存。

进程状态

我们可以查看内核中的源码,来看看进程的各种状态

代码语言:javascript
复制
/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {
"R (running)", /* 0 */
"S (sleeping)", /* 1 */
"D (disk sleep)", /* 2 */
"T (stopped)", /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)", /* 16 */
"Z (zombie)", /* 32 */
};

运行状态(R)

R表示该进程处于一种运行状态,不过这里需要注意的是,R状态表示的运行是指只要进程的pcb在运行队列下,都是R,并不是说一定是指在cpu上运行。

我们看一下以下代码:

代码语言:javascript
复制
 #include<stdio.h>
 int main()
 {
   while(1)
   {
     printf("hello world,pid:%d\n",getpid());                                                                                                                    
   }                                                                           
   return 0;                                                                   
 } 

运行结果与疑惑

S表示的是可中断休眠状态,为什么不是R状态呢?实际上确实如我们所说,我们的程序一直在运行,但是,cpu调度的速度实在是太快了,我们很难捕捉到,并且pcb相对于被cpu的调度时间,其余99%的时间都用在了在外设(显示器)的等待队列中排队了。所以,我们可以看到程序在不断打印数据在显示器,但是却捕捉不到cpu调度pcb并执行的那一刻。

不过我们假如将外设这个干扰给屏蔽了,如下:

代码语言:javascript
复制
#include<stdio.h>
 
 int main()
 {
   while(1)
   {}
   return 0;
 } 

小总结一下

  • 只要处在运行队列下,就是R状态(所以我们有时可能会发现多个进程处于R状态,也不足为奇,这不是指它们同时被调度,而是指它们都处在运行队列,等待被cpu调度)

可中断休眠状态(S)

正如上面的图片所示,我们看到S状态是因为程序的pcb99%的时间都在外设的等待队列下排队,而被cpu调度的那一刻我们捕捉不到。这里大家有没有发现,休眠状态与我们的上面讲的阻塞状态一致,阻塞就是指pcb不被cpu调度,去某个资源的队列下等待资源就绪。

事实上确实如此,S状态的本质就是阻塞。(pcb去某种资源的等待队列下排队,等待资源就绪)。至于说它是可中断休眠,是因为我们可以通过ctrl c或者kill命令来结束该进程。

  • (可以这么来说: S状态就意味着进程在等待事件完成(等待资源就绪),并且这种状态是可以被我们使用指令来中断。

可中断休眠

不可中断休眠状态(D)

所谓不可中断休眠状态,说白了就是我们不可以使用kill、ctrl c等命令将进程中断,我们只可以将电源关闭,以此来结束进程,但是这样做可能会造成数据的丢失等问题。(这种状态一般很难看到)

暂停状态(T)

暂停状态顾名思义就是让该进程暂停,我们可以通过指令kill -19 pid的指令来暂停该进程。输入指令kill -18 pid可以使该进程继续运行。

(不过需要注意的是,当恢复运行时,此时的进程就处于后台进程,我们用ctrl c结束不了,用kill指令才可以中止进程,关于前后台进程我会在后面的章节讲解。)

如下:

死亡状态(X)

  • 这个状态只是一个返回状态,表示该进程已经彻底结束。我们不会在任务列表里看到这个状态。

僵尸状态(Z)

返回代码

我们每一个进程结束时都会有一个退出码,就好像我们写一个main函数时,最后都会加上return 0,return 0就表示该进程正常返回(事实上就算我们不写return 0,系统也会默认return 0),这里的0就是该进程的返回代码

(Linux下可以通过echo $?指令来查看该进程的返回代码)

vs下编译后的返回代码

僵尸状态(Z)

僵尸状态是指一个进程结束时,它的返回代码没有被父进程读取,那么该进程会一直处于一种僵尸状态,等待父进程读取,直到父进程读取返回结果后,才彻底结束子进程。

保持僵尸状态是为了让父进程读取该进程的返回代码,而我们平常写的程序为什么结束后没有变成僵尸呢?

  • 这是因为他们的父进程是bash(不理解的可以看前面的章节,有讲到bash下运行的程序的父进程都是bash),而bash有回收机制,所以我们写的程序运行结束后会被bash的回收机制回收。我们也就观察不到僵尸进程。

不过我们可以写以下代码,用fork创建子进程,来观察僵尸状态:

代码语言:javascript
复制
 #include<stdio.h>
 #include<unistd.h>
 
 int main()
 {
   //fork创建子进程
   pid_t id=fork();
   if(id == 0)
   {
     //child
     while(1)
     {
       printf("子进程:pid:%d,ppid:%d\n",getpid(),getppid());
       sleep(1);
     }
   }
   else
   {
     //father
     while(1)
     {
       printf("父进程,pid:%d,ppid:%d\n",getpid(),getppid());
       sleep(1);
     }
   }
   return 0;                                                                                                                
 }  

此时我们kill -9 进程pid结束子进程,观察子进程是否立马结束,还是如我们所说维持僵尸状态,等待父进程读取推出结果。通过以下运行结果可以发现,子进程并不是直接退出

运行结果

僵尸状态的危害

如果一个进程处于Z状态,假如它的父进程一直不读取该进程的退出码,那么该进程会一直维持僵尸状态。而维护这个状态,实际上就是维护这个数据,该数据也属于进程基本信息,保存在task_struct(PCB)中,不仅 占用了内存空间(因为task_struct本身是一个结构体,结构体都会有自己的大小),并且 维护pcb也是有一定的代价的。

★简单总结一下

  • R状态是指该进程的pcb处在运行队列,而不是一定要在cpu上运行
  • pcb被cpu调度运行的时间,远远远远快于pcb在资源的等待队列下等待资源就绪的时间
  • S与D的区别在于是否可以通过kill或者ctrl c来人为中止进程,但两者本质都是阻塞
  • kill -19 PID 暂停进程,kill -18 PID恢复进程(恢复后的进程属于后台进程,不可ctrl c中止,可以kill -9 PID中止)
  • 暂停状态实际上也是阻塞(要等待你发出指令继续运行)
  • 僵尸状态是指子进程退出时,退出结果没有被父进程读取,子进程就会保持僵尸状态,直到父进程读取返回结果,才彻底结束
  • bash有回收机制,所以我们写的程序运行结束后,不会变成僵尸,会被bash的回收机制回收
  • 僵尸进程会占用空间资源,造成资源泄露,具有一定的危害性,具体避免方式以后再细谈

孤儿进程

我们上面讲了子进程退出时不会立马退出,而是维持僵尸状态等待父进程读取退出结果。(如果父进程是bash,则会被bash的回收机制回收,不会出现僵尸)

那么假如子进程正常运行,父进程结束呢?如下:

杀掉父进程,发现子进程的父进程变成了1号

这里我们来分析一下,为什么父进程结束后不会出现僵尸呢?

  • 答:因为该父进程的父进程为bash,退出结果被bash的回收机制回收了,所以父进程没出现僵尸。

为什么该父进程的子进程被1号进程领养了呢?1号进程是什么?

1号进程实际上就是操作系统

  • 答:父进程退出,子进程被操作系统领养(通过让子进程的父进程变成1号进程),此时的子进程就是孤儿进程。被领养是为了读取子进程的退出结果。(假如没有被领养的话,子进程的退出结果就不会有人能拿到,那么子进程就成了僵尸,会一直存在,造成内存泄漏。这是OS不允许的,所以会让1号进程成为子进程的父进程,从而拿到子进程的退出结果)。

生活原本沉闷,但跑起来就会有风!🌹

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-03-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
    • 章节介绍
      • 阻塞与挂起
        • ★简单总结
        • 进程状态
          • 运行状态(R)
            • 可中断休眠状态(S)
              • 不可中断休眠状态(D)
                • 暂停状态(T)
                  • 死亡状态(X)
                    • 僵尸状态(Z)
                      • ★简单总结一下
                      • 孤儿进程
                      相关产品与服务
                      云服务器
                      云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
                      领券
                      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档