前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一文搞懂Linux信号【下】

一文搞懂Linux信号【下】

作者头像
用户11173787
发布2024-06-24 12:27:38
820
发布2024-06-24 12:27:38
举报
文章被收录于专栏:破晓破晓

🚩引言

在观看本博客之前,建议大家先看一文搞懂Linux信号【上】。由于上一篇博客篇幅太长,为了更好的阅读体验,我拆成了两篇博客。那么接下来,在上一篇的基础上,我们继续学习Linux信号部分。本篇我们主要谈论信号保存和信号处理。

🚩阻塞信号

🌸信号的其他几个相关的概念

首先,先向大家抛出信号中的几个概念

  • 实际执行信号的处理动作称为信号递达(Delivery)
  • 信号从产生到递达之间的状态,称为信号未决(Pending)。
  • 进程可以选择阻塞 (Block )某个信号,
  • 被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作.
  • 注意,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作。

张三在上小学时,非常讨厌数学老师,但是数学老师又很凶。有一次上课时,老师说:“拿起本子记一下作业”。尽管很不喜欢这个老师,但又很害怕这几老师,张三无奈的记下了作业,想着:我现在先不写,假如老师真的发现我没写作业的话,我再写。而相比于懦弱的张三,头铁的李四则选择压根不写,忽略这次信号。

在这里,信号就像是作业。张三选择先记下作业,这就像是阻塞信号,等到什么时候被发现了,才写,写作业的过程,就是信号递达的过程。而李四的行为就是兑现好做出了处理,这个处理就是忽略。

阻塞和忽略是两个不同的概念:

阻塞信号是指在信号还未到来之前,先对某个信号阻塞,等到阻塞解除,才对信号做出处理动作。

忽略:忽略本身就信号的处理动作,只不过这个处理动作是忽略。

🚩信号保存

🚀pending位图

我们再一文搞懂Linux信号【上】中说过:信号在内核中是以unsigned int类型的位图来保存的,从低位到高位,比特位的位置代表信号的编号,比特位的内容代表是否收到对应的信号,0代表没有收到,1代表收到了对应的信号。这个位图就叫做pending位图。

所以:发送信号的本质就是修改pending位图。与其说发送信号,不如说是写信号。由于pending位图在task_struct结构体中,属于内核数据结构,所以修改位图的结构只能是操作系统。

🚀block位图

在操作系统,还有一个位图结构,叫作lock位图。

在block位图中,比特位的位置代表对应的信号的编号。对应的比特位为0,代表该信号没有被阻塞,可以递达;对应的比特位为1,代表该信号被阻塞,无法递达,除非解除阻塞。

所以,一个信号要想递达,①要将pending位图中对应的比特位置为1,②要将block位图中对应的比特位置为0。

🚀hander数组

在进程的task_struct结构体中,存在着一个存放sighander_t*类型的指针数组。在这个数组中,数组的位置代表信号的编号, 数组下标的内容,代表对应信号的处理方法(自定义行为)。当上层调用signal设置自定义行为时,操作系统会将自定义函数的地址传入该数组中,然后对信号进行捕捉时,通过数组中的地址找到对应的处理方法,完成捕捉。

如图:

针对如上的三个结构,需要说明的有:

  1. 一个信号没有被发送,并不影响这个信号被阻塞。
  2. 我们刚开始学习信号时,知道操作系统认识对应的信号是通过程序员的编码完成的。现在我们知道每一个信号的相关信息都会被设置进3个结果中,等到信号来临时,就可以做出处理动作。
  3. 由于信号是用位图来保存的,所以,当操作系统连续多次向某个进程发送大量同种信号时,pending位图也只能记录一次。其他信号也就会丢失。

🚩信号捕捉

从刚一开始接触信号时,我们就说:信号在产生的时候,不会被立即处理,而是要等到合适的时候再进行处理。什么是合适的时候呢?在进程从内核态返回用户态的时候,也就代表着曾经我一定进入过内核态。为了方便讲解,我们先补充一些预备知识。

🚀用户态和内核态

如图所示

代码的运行状态分为两种:用户态和内核态,用户态是最基本的运行状态,自己所写的代码全部都是用户态的代码,内核态则比较高级。

当代码中出现①使用操作系统的自身资源(getpid,waitpid.......)②涉及访问硬件资源(printf,scanf.......)时。用户为了访问这些资源,必须直接或者间接的使用操作系统提供的系统调用接口。但是普通用户无法直接调用系统调用接口,必须让自己的身份从用户态变为内核态。实际执行系统调用的进程,但是身份其实是内核。这里,还要说明一点:因为从用户态访问内核资源还要发生身份的变化,成本较高,所以往往系统调用比较浪费时间,所以尽量不要频繁的调用系统调用接口。

🚩cpu和寄存器

对于cpu大家都不陌生,负责数据的运算。在cpu中有大量的寄存器,这些寄存器分为可见寄存器和不可见寄存器。其中很多寄存器都和进程是强相关的,保存着进程的上下文数据。寄存器属于操作系统,但寄存器内的数据属于进程。当一个进程在cpu上运行时,有关该进程的数据都被投递到寄存器中。典型的比如:①当前进程的task_struct地址②页表的起始地址(方便虚拟内存和物理内存之间的转化)都被投递到不同的寄存器中。

其中,有一个名为CR3的寄存器,这个寄存器表征当前进程是处于用户态还是内核态。寄存器内的数字为0表示处于内核态,数字为3表示处于用户态。

🚀深挖虚拟内存空间

我们之前在将虚拟内存时,知道虚拟内存一共有4G的空间,其中3G的空间是用户空间,该块空间通过页表和物理内存映射,进而读取用户代码和数据。但是还存在1G的内核空间呢?这是什么鬼?干什么用的?

这块空间同样通过页表和物理内存形成映射,只不过想映射的物理内存中存储的不再是用户的代码和数据,而是操作系统和系统调用的相关代码数据和方法。

用户空间和内核空间的页表等等有什么不同呢?

  • 用户空间属于该进程的空间,具有私密性,同时每个进程都有相对应的用户空间页表结构,且不同进程的用户级页表不同。
  • 在操作系统启动时,操作系统的相关的代码和数据加载到对应的物理内存,由于操作系统只有一个,所以所有的进程共享一个内核级页表,不具有私密性。

所以,如果进程想要访问操作系统的资源,该如何做?

  1. 将CPU中的CR3寄存器储存的值由3变为0
  2. 在进程地址空间中,在空间的上下文之间进行跳转。由用户级空间跳转到内核级空间,通过内核级页表映射,找到系统调用的执行方法。

所以,我们知道从用户态和内核态之间的跳转是非常浪费资源的。当代码执行到需要访问操作系统资源的时候,尽管浪费资源和时间,但是进程还要从用户态变为内核态,然后执行相关的系统调用接口。但是,站在进程的角度,它认为跳转一次太慢了,必须把所有只能在内核态中才能进行的操作完成。进程从用户态切换成内核态常见的原因有:系统调用,进程切换。

因为处理信号也需要在内核态中进行。所以进程就开始检查信号对应的block位图和pending位图。

检查顺序为先查block位图,然后再查pending位图。我展开说一下:

  1. 首先,查block位图。如果比特位为1,表示被阻塞,然后接着下一位比特位;如果比特位为0,再看pending中该信号对应的比特位,如果为0,接着查block位图的下一位比特位;如果比特位为1,说明该信号目前处于未决状态,应立即处理。然后查对应的处理方法hander表。

但是如果这个信号对应的处理方法是自定义行为呢?自定义函数属于自己编写的代码,在用户态中,操作系统允许进程在内核态中运行用户态的代码吗?

不行。理论上可以,但是操作系统为了安全,不敢这么干。因为它并不知道这个方法要干什么,万一要是恶意者恶搞系统咋办,所以,操作系统能力让进程在内核态中执行用户态的代码,但是不敢这么做。如果进程处于用户态然后执行这个方法,操作系统就没必要担心了,出了事也是这个进程被终止,和操作系统没关系。,

所以,为了执行信号的自定义方法,进程必须从内核态中返回用户态

当执行完方法后,如果有需要,进程还要返回内核态中,继续运行程序。

总结一下:

我们看到,其实整个过程看起来就像是个躺着的8。我把整个过程分为4个小过程,逐一说明

①代码在执行过程中遇到了系统调用或者时间片已到要进行程序替换。进程从用户态变为内核态来执行该过程。

②执行完毕。由于进程状态切换太浪费资源,进程就像一次性把要在内核态中干的所有事情全部搞完,再返回内核态。所以就检测是否收到了信号,如果收到了信号,并且处理方法是自定义方法,在用户态对应的物理内存。

③进程为了执行信号的处理方法,返回用户态执行。执行完毕后,返回内核态继续干其他工作。

④当进程把所有只能在内核态中运行的操作,全部完成后,返回用户态执行。

🚩操作信号集

我们的信号位图又称信号集,分为pending信号集和block信号集。block信号集又称信号屏蔽字。

1.信号集操作函数
代码语言:javascript
复制
#include <signal.h>
int sigemptyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset (sigset_t *set, int signo);
int sigdelset(sigset_t *set, int signo);
int sigismember(const sigset_t *set, int signo); 

  • 函数sigemptyset初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含 任何有效信号。
  • 函数sigfillset初始化set所指向的信号集,使其中所有信号的对应bit置1,表示该信号集的有效信号包括系统支持的所有信号。
  • 在使用sigset_ t类型的变量之前,一定要调用sigemptyset 或sigfillset 做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。
  • 这四个函数都是成功返回0,出错返回-1。
  • sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回1,不包含则返回0,出错返回-1。
2.其它操作函数

调用函数sigprocmask可以读取或更改进程的信号屏蔽字(block)。

代码语言:javascript
复制
#include <signal.h>
int sigprocmask(int how, const sigset_t *set, sigset_t *oset); 
返回值:若成功则为0,若出错则为-1 

如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则 更改进程的信号屏蔽字,参数how指示如何更改。如果oset和set都是非空指针,则先将原来的信号屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。

SIG_BLOCK:将set指向信号集中的信号,添加到进程阻塞信号集; SIG_UNBLOCK:将set指向信号集中的信号,从进程阻塞信号集删除; SIG_SETMASK:将set指向信号集中的信号,设置成进程阻塞信号集;

调用函数sigpending可以读取当前进程的未决信号集,

代码语言:javascript
复制
#include <signal.h>
int sigpending(sigset_t *set);

现在我们用上述函数来测试一下信号递达的过程:首先是对SIGINT信号进行阻塞,然后通过ctrl+c 发送SIGINT 信号,发现SIGINT信号在pending位图中别标记为1,但是信号未决,直到解除对SIGINT信号的屏蔽,SIGINT信号递达,后续再发送SIGINT信号,会被直接递达,因为ISGINT并没有被阻塞。

代码语言:javascript
复制
#include<iostream>
#include<unistd.h>
#include<signal.h>
#include<cassert>
#include<vector>
#define NUM 32
using namespace std;
vector<int>sigarr={2};
// 打印信号集
static void show_pending(const sigset_t &s)
{
    for(int signo=32;signo>=1;signo--)
    {
        if(sigismember(&s,signo))
        {
            cout<<"1";
        }
        else
        {
            cout<<"0";
        }
    }
    cout<<" "<<endl;

}
// 自定义信号处理方法
void hander(int signo)
{
    cout<<"收到一个信号:"<<signo<<endl;

}
int main()
{   
    //自定义行为
    for(auto signo:sigarr)
    {
        signal(signo,hander);
    }
    // 初始化信号集
    sigset_t block,oblock,pending;
    sigemptyset(&block);
    sigemptyset(&oblock);
    sigemptyset(&pending);
    
    for(auto signo:sigarr)
    {
        sigaddset(&block,signo);
    }
    // 写入信号屏蔽字中
    sigprocmask(SIG_SETMASK,&block,&oblock);

    int cnt=5;
    while(1)
    {
        // 读取pending信号集
        sigpending(&pending);
        show_pending(pending);

        sleep(1);
        
        if(cnt--==0)
        {
            cout<<"信号屏蔽字已更改"<<endl;

            sigprocmask(SIG_SETMASK,&oblock,&block);
        }
        cout<<"----------------------------------------------"<<endl;

    }
    
    
}

代码运行如下:

🚩总结:

  • 我们可以选择性的对信号做出阻塞。要分清阻塞和忽略的区别。
  • 在task_struct中,有pending位图负责保存收到信号,block位图负责保存阻塞的信号,还有一个指针数组指向信号的处理方法。
  • 信号在进程由内核态返回用户态时进行处理,要牢记信号捕捉的过程。
  • 要熟悉操作信号位图的函数。

本文到这里,就结束了,谢谢大家的观看。我们下一篇博客再见。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-06-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 🚩引言
  • 🚩阻塞信号
  • 🚩信号保存
  • 🚩信号捕捉
  • 🚩操作信号集
    • 1.信号集操作函数
      • 2.其它操作函数
      • 🚩总结:
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档