前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >日常运维管理(一)

日常运维管理(一)

作者头像
老七Linux
发布2018-05-09 15:53:20
3K0
发布2018-05-09 15:53:20
举报

监控系统状态

w:

# w/uptime:查看系统负载

16:08:52 up 2 days, 21:49, 1 user, load average: 0.00, 0.00, 0.00

USER TTY FROM [email protected] IDLE JCPU PCPU WHAT

root pts/0 221.224.0.190 14:15 0.00s 0.01s 0.00s w

从左到右依次为 系统时间 开机了多少天 当前用户(下面会显示详细的用户,pts/0 意思是:当前用户是通过网络登录,tty1 是代表直接登录) 系统平均1分钟负载状态平均5分钟负载状态平均15分钟负载状态。当你的cpu为1核时,理想状态为小于等于1.00同理推算其它不同核心的cpu。

# cat /proc/cpuinfo       //查看cpu核数


vmstat:

# vmstat:监控系统状态

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----

r b swpd free buff cache si so bi bo in cs us sy id wa st

0 0 0 532216 65716 102220 0 0 2 29 166 96 2 1 97 1 0

以下几点我们需要关注:

r,run的简写,表示有多少个进程目前出在run的状态

b,block的简写,这个进程被cpu以外的例如硬盘或网络(网速慢)堵死了,阻挡了。

swpd,交换空间,当内存不够的时候,系统可以临时把一些进程移到swp中去。(如果这个数据不变,代表正常,如果数据不停的变化,代表内存和交换分区不停的交换数据,同时,si,so也一定会不停的变化,内存不足)

si,参照物为内存 in,有多少KB的数据块,在等待进入内存

so,参照物为内存 out,有多少KB的数据块,从内存中出来

bi,从硬盘中读数据

bo,从硬盘中写数据

us,用户占用系统资源,如果长期大于60,代表着资源也不够了 <100% (us+sy+id=100)

wa,wait 等待,等待cpu的百分百,有多少个进程在等待cpu

#vmstat 2 10         //显示系统负载状态,每隔两秒显示一次,显示10次

通过vmstat我们可以判断出系统哪部分硬件资源不足!


top:

top:进程使用资源情况

虽然我们知道是内存不足,或者cpu资源不足,但是我们需要通过top去查看到底是哪个进程导致的不足!

top - 17:12:16 up 2 days, 22:52, 1 user, load average: 0.00, 0.00, 0.00

Tasks: 95 total, 1 running, 94 sleeping, 0 stopped, 0 zombie

Cpu(s): 0.3%us, 0.3%sy, 0.0%ni, 99.3%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

Mem: 1020108k total, 491192k used, 528916k free, 67840k buffers

Swap: 0k total, 0k used, 0k free, 103328k cached

每3秒钟动态刷新进程占用率。

默认是按照cpu百分比排序

RES:物理内存使用量 默认KB

按大写的M(大写)则会按照使用内存大小排序

恢复使用CPU排序按P(大写)

按数字1可以显示所有cpu所占的百分比

#top -c       //显示详细的进程信息

#top -bn1       //静态一次性的显示所有进程信息(在脚本会是经常使用)


sar:

sar:监控系统状态(yum install -y sysstat)一般安装之后会在10分钟后才会有抓取的文件。保留一个月的历史!

Linux 2.6.32-696.3.1.el6.x86_64 (VM_106_133_centos) 07/10/17 _x86_64_ (1 CPU)
19:06:14 IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s
19:06:16 lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00
19:06:16 eth0 1.50 1.00 0.17 0.26 0.00 0.00 0.00

rxpck/s:receive 接收到的数据包、(几千还是正常的,如果超过万就不正常了,被攻击了)

txpck/s:trainsmission 发送的数据包、

rxkB/s:接收的数据量 (单位为KB)

txkB/s:发送的数据量 (单位为KB)

# /var/log/sa/     //存放sar历史文件所在的目录

例如:sa目录下有两种类型的文件,sa05 是个二进制文件不可以cat直接查看。相反sar05就可以直接cat查看。

# sar -n DEV 2 10       //代表着抓取网卡的流量包,每隔2秒连续10次

# sar -n DEV -f /var/log/sa/sa05         //如果某天咱们想去查一下流量的历史<经常被使用到>

# sar -q 1 10       //查看系统负载(不讲常用,会使用w)

# sar -q -f /var/log/sa/sa05       //经常用到的是查看历史

# sar -b 1 10          //查看硬盘读取负载(如上查看历史)


nload:

nload:直观的查看网卡流量

# yum install -y epel-release

# yum install -y nload

# nload       //直观动态的看到网卡的流量动向(q 退出)左右方向键切换网卡

有攻击的话,一般进来的流量会很大!

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2016/07/10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 监控系统状态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档