服务器内存使用率太高_服务器内存使用率太高_linux 内存使用率太高 - 腾讯云开发者社区

某公司新开发了一款大IP手游。上线之后不久，发现几十个人上线之后服务器就崩溃了。一开始还能用大量预算来购买服务器用以支撑，但几天之后由于宣传火爆，随着用户的增多，这才发现单纯增加服务器的成本实在太高了。玩家开始逐渐骂服务器垃圾，各种掉线、卡顿、crash。本想领先竞品抢先进入市场，结果收获的却是满怀期待玩家们的流失。为什么！因为没有做压力测试！

Linux vmstat命令实战详解

vmstat命令是最常见的Linux/Unix监控工具，可以展现给定时间间隔的服务器的状态值,包括服务器的CPU使用率，内存使用，虚拟内存交换情况,IO读写情况。这个命令是我查看Linux/Unix最喜爱的命令，一个是Linux/Unix都支持，二是相比top，我可以看到整个机器的CPU,内存,IO的使用情况，而不是单单看到各个进程的CPU使用率和内存使用率(使用场景不一样)。选项 -a：显示活动内页； -f：显示启动后创建的进程总数； -m：显示slab信息； -n：头信息仅显示一次； -s：以表格方式显示事件计数器和内存状态； -d：报告磁盘状态； -p：显示指定的硬盘分区状态； -S：输出信息的单位。 vmstat 3 procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------ r b swpd free buff cache si so bi bo in cs us sy id wa st 0 0 320 42188 167332 1534368 0 0 4 7 1 0 0 0 99 0 0 0 0 320 42188 167332 1534392 0 0 0 0 1002 39 0 0 100 0 0 0 0 320 42188 167336 1534392 0 0 0 19 1002 44 0 0 100 0 0 0 0 320 42188 167336 1534392 0 0 0 0 1002 41 0 0 100 0 0 0 0 320 42188 167336 1534392 0 0 0 0 1002 41 0 0 100 0 0 一般vmstat工具的使用是通过两个数字参数来完成的，第一个参数是采样的时间间隔数，单位是秒，第二个参数是采样的次数 r 表示运行队列(就是说多少个进程真的分配到CPU)，我测试的服务器目前CPU比较空闲，没什么程序在跑，当这个值超过了CPU数目，就会出现CPU瓶颈了。这个也和top的负载有关系，一般负载超过了3就比较高，超过了5就高，超过了10就不正常了，服务器的状态很危险。top的负载类似每秒的运行队列。如果运行队列过大，表示你的CPU很繁忙，一般会造成CPU使用率很高。 b 表示阻塞的进程,这个不多说，进程阻塞，大家懂的。 swpd 虚拟内存已使用的大小，如果大于0，表示你的机器物理内存不足了，如果不是程序内存泄露的原因，那么你该升级内存了或者把耗内存的任务迁移到其他机器。 free 空闲的物理内存的大小，我的机器内存总共8G，剩余3415M。 buff Linux/Unix系统是用来存储，目录里面有什么内容，权限等的缓存，我本机大概占用300多M cache cache直接用来记忆我们打开的文件,给文件做缓冲，我本机大概占用300多M(这里是Linux/Unix的聪明之处，把空闲的物理内存的一部分拿来做文件和目录的缓存，是为了提高程序执行的性能，当程序使用内存时，buffer/cached会很快地被使用。) si 每秒从磁盘读入虚拟内存的大小，如果这个值大于0，表示物理内存不够用或者内存泄露了，要查找耗内存进程解决掉。我的机器内存充裕，一切正常。 so 每秒虚拟内存写入磁盘的大小，如果这个值大于0，同上。 bi 块设备每秒接收的块数量，这里的块设备是指系统上所有的磁盘和其他块设备，默认块大小是1024byte，我本机上没什么IO操作，所以一直是0，但是我曾在处理拷贝大量数据(2-3T)的机器上看过可以达到140000/s，磁盘写入速度差不多140M每秒 bo 块设备每秒发送的块数量，例如我们读取文件，bo就要大于0。bi和bo一般都要接近0，不然就是IO过于频繁，需要调整。 in 每秒CPU的中断次数，包括时间中断 cs 每秒上下文切换次数，例如我们调用系统函数，就要进行上下文切换，线程的切换，也要进程上下文切换，这个值要越小越好，太大了，要考虑调低线程或者进程的数目,例如在apache和nginx这种web服务器中，我们一般做性能测试时会进行几千并发甚至几万并发的测试，选择web服务器的进程可以由进程或者线程的峰值一直下调，压测，直到cs到一个比较小的值，这个进程和线程数就是比较合适的值了。系统调用也是，每次调用系统函数，我们的代码就会进入内核空间，导致上下文切换，这个是很耗资源

您找到你想要的搜索结果了吗？

是的

没有找到

Linux“体检”指标

关于并发下内存及CPU使用情况的思考

鉴于昨天的文章<<使用Interlocked在多线程下进行原子操作，无锁无阻塞的实现线程运行状态判断>>里面有一个封装好的无锁的类库可以判断并发下的结束状况，我们可以完成并发时，以及并发的同时做一些事，因此，今天我做了个小demo:

记一次xmrig挖矿病毒排查日记

一台运行了好久的服务器CPU使用率达到100%，脑海中第一个想法就是中病毒了，于是开始了我的杀毒之旅。

构建企业级监控平台系列（二）：如何做好企业监控系统运维管理？

前面介绍了企业级监控概述及发展等相关的知识点，今天我将详细的为大家介绍如何做好企业监控系统运维相关知识，希望大家能够从中收获多多！如有帮助，请点在看、转发朋友圈支持一波！！！

MySQL CPU性能定位

墨墨导读：经常会看到看到cpu 使用率非常高的情况。在这种情况下，资源的使用监控分析才是性能故障分析的根本首要任务，通过这些分析，理解服务器如何运行，资源损耗在哪些方面对问题进行故障诊断是非常有价值有意义的。

Java 性能调优工具

检查应用性能时，应该首先审查CPU时间。代码优化的目的是提升而不是降低（更短时间段内的）CPU的使用率。在试图深入优化应用前，应该先弄清楚为何CPU使用率低。

案例：Redis命令不当引起数据库雪崩造成数百万损失

最近的互联网线上事故发生比较频繁，9月19日网上爆料出顺丰近期发生了一起线上删库事件，在这里就不介绍了。

运维必知必会的监控知识体系全梳理

监控是整个运维乃至整个产品生命周期中最重要的一环，事前及时预警发现故障，事后提供详实的数据用于追查定位问题。

运维必知必会的监控知识体系全梳理

监控是整个运维乃至整个产品生命周期中最重要的一环，事前及时预警发现故障，事后提供详实的数据用于追查定位问题。目前业界有很多不错的开源产品可供选择。选择一款开源的监控系统，是一个省时省力、效率最高的方案。当然，对监控不是很明白的朋友们，看了以下文章可能会对监控整个体系有比较深刻的认识。

做了5年运维，靠着这份监控知识体系，我从3K变成了40K

[使用Python监控Linux/Unix系统] 使用paramiko获取linux系统内存使用率

前面介绍了如何运用Python获取Oracle数据库的信息以及将数据存入MySQL数据库中

探索使用Kubernetes扩展专用游戏服务器：第2部分-管理CPU和内存

在本系列的第 1 部分中，我们讨论了如何使用专用游戏服务器，将其与 Docker 打包，然后在Kubernetes 上托管和管理它，这是一个很好的开始。然而，由于我们的 Kubernetes 集群通常是固定大小的，我们可能会耗尽所有可用容量来运行我们需要的所有游戏服务器容器，以匹配所有想玩我们的游戏的玩家——这将是一件非常糟糕的事情。

系统之眼！Linux系统性能监控工具Glances

glances是一个基于python语言开发，可以为linux或者UNIX性能提供监视和分析性能数据的功能。glances在用户的终端上显示重要的系统信息，并动态的进行更新，让管理员实时掌握系统资源的使用情况，而动态监控并不会消耗大量的系统资源，比如CPU资源，通常消耗小于2%，glances默认每两秒更新一次数据。同时glances还可以将相同的数据捕获到一个文件，便于以后对报告进行分析和图形绘制，支持的文件格式有.csv电子表格格式和和html格式。

【经验】通过JVM调优，让凯哥个人博客响应速度提升了不少

不知道大家有没有注意到，在22.10.31 21点之后，凯哥的个人博客站点(凯哥Java:www.kaigejava.com)访问速度提升了不少。那是因为凯哥对站点做了优化。本文就记录优化方面：

性能工具之linux监控之top、vmstat、iostat复习

Ø d 指定每两次屏幕信息刷新之间的时间间隔。当然用户可以使用s交互命令来改变之。

[使用Python监控Linux/Unix系统] 使用paramiko获取linux系统CPU使用率

前面介绍了如何运用Python获取Oracle数据库的信息以及将数据存入MySQL数据库中

性能测试之如何分析CPU异常曲线

性能测试为保证软件质量起到重要作用，对于交易量较大的应用系统，性能测试更是一个必不可少的环节。

Python3监控windows,linux系统的CPU、硬盘、内存使用率和各个端口的开启情况详细代码实例

由于项目的需要，需要做一个简单监控服务器的CPU利用率、CPU负载、硬盘使用率、内存利用率和服务器的各个端口的开启情况的程序，并把结果通知到监控平台，如果出现异常，监控平台打电话或者发短信通知给具体的运维人员

【软件测试系列九】《压力测试申请需提供事项说明》

本文档是完成***压力测试的指导性文件。本文档给出了对测试需求、测试环境、测试过程及测试结果的总体要求, 这也是本测试项目中其他文档编写及结果评价的基础。

简析OpenTSDB的用途是什么

OpenTSDB 是一种基于 HBase 编写的分布式、可扩展的时间序列数据库。官方文档这样描述：OpenTSDB is a distributed, scalable Time Series Database (TSDB) written on top of HBase；翻译过来就是，基于Hbase的分布式的，可伸缩的时间序列数据库，和上面的意思基本相同。主要用途，就是做监控系统；譬如收集大规模集群（包括网络设备、操作系统、应用程序）的监控数据并进行存储，查询。存储到OpenTSDB的数据，是以me

如何用Python发送告警通知到钉钉？

前不久，看到了明哥写的如何用Python发送警告通知到企业微信，想起来之前写过用Pytho发送指定格式数据到钉钉的服务，本文将之前的代码重构下，变成一个：利用Python监控服务器数据，然后有异常就通过钉钉发送给用户。

Linux性能优化

性能问题的本质就是系统资源已经到达瓶颈，但请求的处理还不够快，无法支撑更多的请求。性能分析实际上就是找出应用或系统的瓶颈，设法去避免或缓解它们。

Linux 性能优化的全景指南，可能都在这里了，建议收藏~

架构必知：Linux性能优化全景指南（建议收藏）

Part1Linux性能优化 1性能优化性能指标高并发和响应快对应着性能优化的两个核心指标：吞吐和延时

基于crontab和shell实现监控告警

市面上有很多开源的监控告警工具,提供了丰富的、可视化的监控指标,以及告警能力,而对于服务器维度,抛开业务指标外,我们关注的无外乎cpu使用率、内存使用率和磁盘使用率等是否超过了我们既定的安全阈值,如果超过了则推送告警通知,来引起研发人员的关注,从而采取相应的应对措施。

高可用架构 - 系统性能评估

top 命令重要指标：load average，表示任务队列的平均长度（1分钟、5分钟、15分钟前到现在平均值）。

Linux性能优化指北大全

db file scattered read等待事件

上节我们讲了如何安装paramiko，这节我们讲如何使用paramiko连接服务器

Python中psutil模块应用

psutil（Python system and process utilities）是python的系统监控及进程的管理的工具，是一个功能很强大的跨平台的系统管理库。官方文档（https://pythonhosted.org/psutil/）

Prometheus 监控Linux Windows主机（七）

Node_exporter 用于采集Linux系统指标数据数据，prometheus官方提供的exporter，除node_exporter外，官方还提供consul，memcached，haproxy，mysqld等exporter。

如何理解CPU密集型和 I/O密集型

CPU密集型，也叫计算密集型，一般是指服务器的硬盘、内存硬件性能相对CPU好很多，或者使用率低很多。系统运行CPU读写I/O(硬盘/内存)时可以在很短的时间内完成，几乎没有阻塞（等待I/O的实时间）时间，而CPU一直有大量运算要处理，因此CPU负载长期过高。

Linux CPU 如何判断忙

摘录自：http://www.ruanyifeng.com/blog/2016/12/user_space_vs_kernel_space.html

Linux 操作系统使用Shell脚本监控CPU、磁盘、内存使用率

在日常运维工作中，大部分企业都会搭建自己的可视化监控大屏，但是对于小型企业或者是个人玩家来说这样做的成本和难度会大大提高，下面我就分享一个Shell脚本监控Linux服务器的CPU、磁盘、内存。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐