前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >性能测试必备知识(3)- 深入理解“平均负载”

性能测试必备知识(3)- 深入理解“平均负载”

作者头像
小菠萝测试笔记
发布2020-07-20 16:37:57
4510
发布2020-07-20 16:37:57
举报

uptime 命令入门

每次发现系统变慢时,通常做的第一件事,就是执行 top 或者 uptime 命令,来了解系统的负载情况

六个参数讲解

参数

含义

10:08:47

当前时间

up 10:24

系统运行时间

1 user

正在登录用户数

0.13

过去 1 分钟的平均负载

0.09

过去 5 分钟的平均负载

0.03

过去 15 分钟的平均负载

灵魂拷问

平均负载就是单位时间内的 CPU 使用率吗?上面的0.13,代表 CPU 使用率是13%是吗?

灵魂回答

其实并不是这样的,我们通过 man uptime 查看 uptime 命令的解释

接下来,我们可以进入下一个知识点了

什么是平均负载?

简单来说

单位时间内,系统处于可运行状态不可中断状态的平均进程数,也就是平均活跃进程数,它和 CPU 使用率并没有直接关系

可运行状态的进程

正在使用 CPU 或者正在等待 CPU 的进程,在 ps 命令看到的,处于 R 状态(Running 或 Runnable)的进程

不可中断状态的进程

  • 正处于内核态关键流程中的进程,并且这些流程是不可打断的
  • 比如:最常见的是等待硬件设备的 I/O 响应,也就是在 ps 命令中看到的 D 状态(Uninterruptible Sleep,也称为 Disk Sleep)的进

不可中断状态进程的具体栗子

  • 一个进程向磁盘读写数据时,为了保证数据的一致性,在得到磁盘回复前,它是不能被其他进程或者中断打断的,这个时候的进程就处于不可中断状态
  • 如果此时的进程被打断了,就容易出现磁盘数据与进程数据不一致的问题

总结

  • 不可中断状态实际上是系统对进程和硬件设备的一种保护机制
  • 平均负载可理解成平均活跃进程数
  • 平均活跃进程数,就是单位时间内的活跃进程数

平均负载的理想状态

每个 CPU 上都刚好运行着一个进程,这样每个 CPU 都得到了充分利用

栗子

比如平均负载 = 2时

  • 当系统有 2 个 CPU,意味着所有 CPU 刚好被完全占用
  • 当系统有 4 个 CPU,意味着有 50% 的 CPU 是空闲的
  • 当系统有 1 个 CPU,意味着一半的进程竞争不到 CPU

平均负载为多少时合理

灵魂拷问一

在 uptime 命令的结果里,那三个时间段的平均负载数,多大的时候能说明系统负载高?或是多小的时候就能说明系统负载很低呢?

回答

灵魂拷问二

平均负载有三个数值,到底该参考哪一个呢?

回答

都要看,三个不同时间间隔的平均值,提供了分析系统负载趋势的数据来源,可以更全面地了解目前的负载状态

参考栗子
  • 1 分钟、5 分钟、15 分钟的三个值基本相同,相差不大:系统负载很平稳
  • 1 分钟的值远小于 15 分钟的值:系统最近 1 分钟的负载在减少,而过去 15 分钟内却有很大的负载
  • 1 分钟的值远大于 15 分钟的值:系统最近 1 分钟的负载在增加,这种情况需要观察,因为可能是临时性的,也可能是持续性;
  • 一旦 1 分钟的平均负载接近或超过了 CPU 的个数,就意味着系统正在发生过载的问题,这时就得分析调查是哪里导致的问题,并要想办法优化了
实际栗子

假设在一个单 CPU 系统上看到平均负载为 1.73,0.60,7.98

  • 1 分钟内:系统有 73% 的超载
  • 15分钟内:系统有 698% 的超载
  • 从整体趋势来看:系统的负载在降低

灵魂拷问三

在实际生产环境中,平均负载多高时,需要重点关注?

回答
  • 平均负载高于 CPU 数量 70% 的时候,就应该考虑分析排查负载高的问题了
  • 一旦负载过高,可能导致进程响应变慢,进而影响服务的正常功能
  • 但 70% 这个数字只是建议,可根据业务变化
  • 最好的办法还是将系统的平均负载监控起来,然后根据更多的历史数据,判断负载的变化趋势
  • 当发现负载有明细升高趋势时,比如:负载翻倍了,再去做分析和调查

平均负载和 CPU 使用率的关系

提出疑问

平均负载就是平均活跃进程数,那活跃进程数多了,不就等于 CPU 使用率高嘛?

回答
  • 前面说到,平均负载时指单位时间内,处于可运行状态和不可中断状态的进程数
  • 这里包括了:正在使用 CPU 的进程,等待使用 CPU 的进程,等待 I/O 的进程
  • 而 CPU 使用率,是单位时间内 CPU 繁忙情况的统计,跟平均负载并不一定完全对应
平均负载和 CPU 使用率的一些小栗子
  • CPU 密集型进程:使用大量 CPU 会导致平均负载升高,此时两者是一致的
  • I/O密集型进程:等待 I/O 也会导致平均负载身高,但 CPU 使用率不一定很高
  • 大量等待 CPU 的进程调度也会导致平均负载升高,此时的 CPU 使用率也会比较高
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2020-07-16 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • uptime 命令入门
    • 六个参数讲解
      • 灵魂拷问
        • 灵魂回答
        • 什么是平均负载?
          • 简单来说
            • 可运行状态的进程
              • 不可中断状态的进程
                • 不可中断状态进程的具体栗子
                  • 总结
                    • 栗子
                • 平均负载的理想状态
                • 平均负载为多少时合理
                  • 灵魂拷问一
                    • 回答
                  • 灵魂拷问二
                    • 回答
                    • 参考栗子
                    • 实际栗子
                  • 灵魂拷问三
                    • 回答
                    • 提出疑问
                    • 回答
                    • 平均负载和 CPU 使用率的一些小栗子
                • 平均负载和 CPU 使用率的关系
                领券
                问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档