前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CPU load 高占用率低问题的排查

CPU load 高占用率低问题的排查

作者头像
用户3147702
发布2022-06-27 13:09:29
4.2K0
发布2022-06-27 13:09:29
举报
文章被收录于专栏:小脑斧科技博客

# 1. 引言 突然观察到服务器 load 过高,可是 CPU 占用率很低。 这也算是一个常见问题了。 那么,如何排查和解决这个问题呢?

2. top 查看 cpu wait

通过 top 命令,可以看到 CPU 的 wait 很高,可以参考: top 命令详解

2.1. 诊断

  • 若 wait 值过高,则说明磁盘 IO 存在瓶颈
  • 若 idle 值高,但 load 仍很高则说明内存容量不足
  • 若 idle 值持续低于 1,则系统的 CPU 处理能力存在瓶颈

3. iostat 分析 IO 性能

我们通过 iostat 可以分析 IO 性能。 通常通过 -x 参数显示详细信息。 下面是一个示例,执行:

iostat -x -k 3 2

3.1. 参数说明

  • -x — 显示详细信息
  • -k — 以 KB 为单位
  • -m — 以 MB 为单位
  • 3 — 每 3 秒执行一次
  • 2 — 总共执行 2 次
  • 需要注意的是,第1次采样信息与单独执行iostat的效果一样,为从系统开机到当前执行时刻的统计信息,第2次及此后才是当前的实时数据

3.2. 返回信息

返回信息总共包含三部分:

iostat 命令返回信息

选项

说明

第一行

最上面指示系统版本、主机名和当前日期

avg-cpu

总体cpu使用情况统计信息,对于多核cpu,这里为所有cpu的平均值

Device

各磁盘设备的IO统计信息

3.3. 返回信息 — avg-cpu

avg-cpu中各列参数含义如下:

iostat 返回的 avg-cpu 信息

选项

说明

%user

CPU在用户态执行进程的时间百分比。

%nice

CPU在用户态模式下,用于nice操作,所占用CPU总时间的百分比

%system

CPU处在内核态执行进程的时间百分比

%iowait

CPU用于等待I/O操作占用CPU总时间的百分比

%steal

管理程序(hypervisor)为另一个虚拟进程提供服务而等待虚拟CPU的百分比

%idle

CPU空闲时间百分比

3.4. 返回信息 — Device

Device 中各列参数含义如下:

iostat 返回的 Device 信息

选项

说明

rrqm/s

每秒对该设备的读请求被合并次数,文件系统会对读取同块(block)的请求进行合并

wrqm/s

每秒对该设备的写请求被合并次数

r/s

每秒完成的读次数

w/s

每秒完成的写次数

rkB/s

每秒读数据量(kB为单位)

wkB/s

每秒写数据量(kB为单位)

avgrq-sz

平均每次IO操作的数据量(扇区数为单位)

avgqu-sz

平均等待处理的IO请求队列长度

await

平均每次IO请求等待时间(包括等待时间和处理时间,毫秒为单位)

svctm

平均每次IO请求的处理时间(毫秒为单位)

%util

采用周期内用于IO操作的时间比率,即IO队列非空的时间比率

3.5. 诊断

通过具体的 Device 中的 %util 可以看出具体是那块磁盘负载过大。

4. 通过iotop查找高I/O对应的进程

执行 iotop 命令可以看到每个进程占用的 io 比例:

我们可以找到占用 IO 最大的 TID 即进程 ID。

5. 通过 lsof -p pid 具体文件

SIZE 一列即读写大小,通过其增长我们就可以锁定究竟是哪个文件造成了 IO 过高。 从而可以分析具体的代码来解决这个问题。

6. 参考资料

https://support.zabbix.com/browse/ZBXNEXT-1914。 https://www.jianshu.com/p/cb64232df70c。 https://blog.csdn.net/xusensen/article/details/73080887。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-12-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小脑斧科技博客 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 2. top 查看 cpu wait
    • 2.1. 诊断
    • 3. iostat 分析 IO 性能
      • 3.1. 参数说明
        • 3.2. 返回信息
          • 3.3. 返回信息 — avg-cpu
            • 3.4. 返回信息 — Device
              • 3.5. 诊断
              • 4. 通过iotop查找高I/O对应的进程
              • 5. 通过 lsof -p pid 具体文件
              • 6. 参考资料
              相关产品与服务
              物联网
              腾讯连连是腾讯云物联网全新商业品牌,它涵盖一站式物联网平台 IoT Explorer,连连官方微信小程序和配套的小程序 SDK、插件和开源 App,并整合腾讯云内优势产品能力,如大数据、音视频、AI等。同时,它打通腾讯系 C 端内容资源,如QQ音乐、微信支付、微保、微众银行、医疗健康等生态应用入口。提供覆盖“云-管-边-端”的物联网基础设施,面向“消费物联”和 “产业物联”两大赛道提供全方位的物联网产品和解决方案,助力企业高效实现数字化转型。
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档