日常运维管理（一）

老七Linux

发布于 2018-05-09 15:53:20

3K0

发布于 2018-05-09 15:53:20

监控系统状态

w：

# w/uptime：查看系统负载

16:08:52 up 2 days, 21:49, 1 user, load average: 0.00, 0.00, 0.00

USER TTY FROM [email protected] IDLE JCPU PCPU WHAT

root pts/0 221.224.0.190 14:15 0.00s 0.01s 0.00s w

从左到右依次为 系统时间 开机了多少天 当前用户（下面会显示详细的用户，pts/0 意思是：当前用户是通过网络登录，tty1 是代表直接登录） 系统平均1分钟负载状态，平均5分钟负载状态，平均15分钟负载状态。当你的cpu为1核时，理想状态为小于等于1.00，同理推算其它不同核心的cpu。

# cat /proc/cpuinfo //查看cpu核数

vmstat：

# vmstat：监控系统状态

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----

r b swpd free buff cache si so bi bo in cs us sy id wa st

0 0 0 532216 65716 102220 0 0 2 29 166 96 2 1 97 1 0

以下几点我们需要关注：

r，run的简写，表示有多少个进程目前出在run的状态

b，block的简写，这个进程被cpu以外的例如硬盘或网络（网速慢）堵死了，阻挡了。

swpd，交换空间，当内存不够的时候，系统可以临时把一些进程移到swp中去。（如果这个数据不变，代表正常，如果数据不停的变化，代表内存和交换分区不停的交换数据，同时，si，so也一定会不停的变化，内存不足）

si，参照物为内存 in，有多少KB的数据块，在等待进入内存

so，参照物为内存 out，有多少KB的数据块，从内存中出来

bi，从硬盘中读数据

bo，从硬盘中写数据

us，用户占用系统资源，如果长期大于60，代表着资源也不够了 <100% (us+sy+id=100)

wa，wait 等待，等待cpu的百分百，有多少个进程在等待cpu

#vmstat 2 10 //显示系统负载状态，每隔两秒显示一次，显示10次

通过vmstat我们可以判断出系统哪部分硬件资源不足！

top：

top：进程使用资源情况

虽然我们知道是内存不足，或者cpu资源不足，但是我们需要通过top去查看到底是哪个进程导致的不足！

top - 17:12:16 up 2 days, 22:52, 1 user, load average: 0.00, 0.00, 0.00

Tasks: 95 total, 1 running, 94 sleeping, 0 stopped, 0 zombie

Cpu(s): 0.3%us, 0.3%sy, 0.0%ni, 99.3%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

Mem: 1020108k total, 491192k used, 528916k free, 67840k buffers

Swap: 0k total, 0k used, 0k free, 103328k cached

每3秒钟动态刷新进程占用率。

默认是按照cpu百分比排序

RES：物理内存使用量默认KB

按大写的M（大写）则会按照使用内存大小排序

恢复使用CPU排序，按P（大写）

按数字1可以显示所有cpu所占的百分比

#top -c //显示详细的进程信息

#top -bn1 //静态一次性的显示所有进程信息（在脚本会是经常使用）

sar：

sar：监控系统状态（yum install -y sysstat）一般安装之后会在10分钟后才会有抓取的文件。保留一个月的历史！

Linux 2.6.32-696.3.1.el6.x86_64 (VM_106_133_centos) 07/10/17 _x86_64_ (1 CPU)
19:06:14 IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s
19:06:16 lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00
19:06:16 eth0 1.50 1.00 0.17 0.26 0.00 0.00 0.00

rxpck/s：receive 接收到的数据包、（几千还是正常的，如果超过万就不正常了，被攻击了）

txpck/s：trainsmission 发送的数据包、

rxkB/s：接收的数据量 （单位为KB）

txkB/s：发送的数据量 （单位为KB）

# /var/log/sa/ //存放sar历史文件所在的目录

例如：sa目录下有两种类型的文件，sa05 是个二进制文件不可以cat直接查看。相反sar05就可以直接cat查看。

# sar -n DEV 2 10 //代表着抓取网卡的流量包，每隔2秒连续10次

# sar -n DEV -f /var/log/sa/sa05 //如果某天咱们想去查一下流量的历史<经常被使用到>

# sar -q 1 10 //查看系统负载（不讲常用，会使用w）

# sar -q -f /var/log/sa/sa05 //经常用到的是查看历史

# sar -b 1 10 //查看硬盘读取负载（如上查看历史）

nload：

nload：直观的查看网卡流量

# yum install -y epel-release

# yum install -y nload

# nload //直观动态的看到网卡的流量动向（q 退出）左右方向键切换网卡

有攻击的话，一般进来的流量会很大！

本文参与腾讯云自媒体同步曝光计划，分享自作者个人站点/博客。

原始发表：2016/07/10，如有侵权请联系 cloudcommunity@tencent.com 删除

运维

本文分享自作者个人站点/博客前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

运维

登录后参与评论

0 条评论

热度