前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >自动驾驶 Apollo 源码分析系列,系统监控篇(四):Monitor模块如何监控进程 Process 的存活状态?

自动驾驶 Apollo 源码分析系列,系统监控篇(四):Monitor模块如何监控进程 Process 的存活状态?

作者头像
Frank909
发布2022-05-10 14:53:17
5420
发布2022-05-10 14:53:17
举报
文章被收录于专栏:Frank909Frank909Frank909

本篇文章分析 Apollo 中监控模块中监控进程状态的相关代码。

1. ProcessMonitor

在这里插入图片描述
在这里插入图片描述

ProcessMonitor 是一个普通的定时器组件,内部函数也只是常规的 RunOnce 和 UpdateStatus,所以,可以推断出它的逻辑非常简单。

但要注意的是它引入的头文件有 hmi_mode 和 system_status 两个,这说明它要从中获取一些数据结构定义。

在这里插入图片描述
在这里插入图片描述

上面的代码说明,ProcessMonitor 中的 RunOnce 每隔 1.5s 被触发一次。

在这里插入图片描述
在这里插入图片描述

工作流程分为 4 个步骤:

  1. 获取正在运行的进程列表
  2. 检测 HMI 中配置的 Module 运行信息
  3. 检测受监控的模块运行信息
  4. 检测其他组件运行信息

2 获取可运行进程信息

这里通过读取 /proc/pid/cmdline 信息

linux 把进程相关的信息映射到虚拟文件系统 /proc 目录下。而/proc/pid/cmdline是一个只读文件,里面存储了相应的进程启动命令行参数。

在这里插入图片描述
在这里插入图片描述

由于在 cmdline 文件下的命令行信息分割符是 ‘\0’,所以,需要把它们替换成空格。

3. 检测 HMI 配置的 Module 运行信息

在这里插入图片描述
在这里插入图片描述

首先,要弄明白两个东西:hmi mode 和 hmi module。 这在前面提到过的头文件中有定义。

在这里插入图片描述
在这里插入图片描述

HMIMode 里面包含了 Modules,是对应的一个 map。 Module 里面通过 ProcessMonitorConfig 指示模块是否正在运行。

在这里插入图片描述
在这里插入图片描述

ProcessMonitorConfig 只是一个 string 类数组,里面存放了进程启动时的命令行参数。

做 HMI Module 检测时,需要传入模块名字和刚获取到的正在运行的进程列表信息,通过 UpdateStatus 函数进行处理。

在这里插入图片描述
在这里插入图片描述

代码很简单,拿 running_processes 中的文本和传入的模块名字匹配,匹配上了就是 OK 的状态结果,否则就是 FATAL 的结果。

4. 检测受监控的 Module 的运行状态

在这里插入图片描述
在这里插入图片描述

逻辑和 hmi module 的一样,只是对象是 monitor components。

在这里插入图片描述
在这里插入图片描述

仍然是通过 ProcessMonitorConfig 判断。

注释里面也有讲到,状态更新时会影响 SystemStatus.components[i].process_status的值。

在这里插入图片描述
在这里插入图片描述

一个 Component 的状态由 1 个概要状态和 5 个子状态组成。

process_status 是其中的 1 个子状态。

所以,现在回看代码,无非也是在 running_processess 列表中找 component 相应的 process_status 信息。

5. 检测其他的组件

在这里插入图片描述
在这里插入图片描述

这个逻辑没有什么差别。

6. 总结与思考

  1. 进程的运行状态只有 OK 和 FATAL 两种。
  2. 核心逻辑是通过程序读取 /proc/pid/cmdline 文件获取到了正在运行的进程名字,然后通过与 HMI 配置的模块名字或者是受监控的组件名字相匹配进行状态的判断。
  3. 我开始有思考一个问题,因为平常开发时查看进程信息都是通过在 console 进行 ps 命令,那与此相比,cmdline 有什么好处呢?后来,我仔细想了想,因为在代码中执行 ps 命令,需要产生额外的开销,而直接读取一个 proc 文件开销较小,由于进程监控是持续性的,所以,读取 cmdline 这个方式比较好。但这是我推测,没有验证,有经验的同学可以指教一下我。
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2022-02-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. ProcessMonitor
  • 2 获取可运行进程信息
  • 3. 检测 HMI 配置的 Module 运行信息
  • 4. 检测受监控的 Module 的运行状态
  • 5. 检测其他的组件
  • 6. 总结与思考
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档