Linux杀不死的进程之CPU使用率这么高

1. 问题发现

[root@zwlbs3 ~]# top

i. 发现有个进程CPU使用率居然700%,COMMAND 是一些随机的字符串组成,完了~ 中标了;第一想到就是“沙雕”它,kill 命令给我上。

[root@zwlbs3 ~]# kill -9 "PID"

ii. 但是发现 kill 该进程平静一会后又启动了。

注:老图复用,PID、COMMAND 都有变化。

2. 查看进程的详细信息

[root@zwlbs3 ~]# cd /proc/748/

[root@zwlbs3 748]# ls -ial

# "748"是该进程的 PID,根据你的 PID 来查看即可。

如图:

发现该进程是在 /dev/shm 目录下的,/dev/shm 是一个什么目录呢?

从网上摘下来一段我们解一下 /dev/shm

1) 首先可以看出来/dev/shm是一个设备文件, 可以把/dev/shm看作是系统内存的入口, 可以把它看做是一块物理存储设备,一个tmp filesystem, 你可以通过这个设备向内存中读写文件, 以加快某些I/O高的操作,比如对一个大型文件频繁的open, write, read。

2) 据说oracle就利用了/dev/shm(shitou没用过oracle), 可以通过mount命令列出当前的/dev/shm的挂载的文件系统。

3) 既然是基于内存的文件系统,系统重启后/dev/shm下的文件就不存在了。Linux默认(CentOS)/dev/shm分区的大小是系统物理内存的50%, 虽说使用/dev/shm对文件操作的效率会高很多。但是目前各发行软件中却很少有使用它的(除了前面提到的Oracle), 可以通过ls /dev/shm查看下面是否有文件, 如果没有就说明当前系统并没有使用该设备。

查看 /dev/shm 目录的有没有相关文件

[root@zwlbs3 ~]# ls -a /dev/shm/

. ..

# 没有任何相关的文件,奇怪了。

crontab 也没有相关计划任务。

使用 which 命令也没有找到相关的文件。

查看系统日志也是正常,非常奇怪。

几乎没有找到该进程相关的文件。

3. 解决办法

i. 查看某个进程内部线程占用情况分析

[root@zwlbs3 ~]# top -H -p "PID"

ii. 原来有这么多相关的进程,全部 kill 掉

iii. 过来几分钟再次检查,发现系统负载恢复正常

本以为解决了,结果过了几个小时检查发现又出现了,该死的。

由于生产环境不方便重启服务器,被逼无奈情况下只好试试 重启大法 了。

4. 重启大法

重启服务器后一个小时,再次检查已经恢复正常了,还是 重启大法 好使。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190816A05TQ900?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券