tsar(Taobao System Activity Reporter)可将收集到的数据存储在磁盘上,另外可以支持将数据存储到MySQL中,也可将数据发送到Nagios报警服务器。在展示数据层面,可以指定模块,并且支持对多条信息的数据进行Merge输出,如果带--live参数,还可以输出秒级的实时信息。tsar 可以监控CPU、IO、内存、TCP等系统状态,也可监控Apache、Nginx/Tengine、Squid等服务器状态。
本文主要介绍tsar 如何监控linux 服务器,有兴趣的朋友可以尝试对 nginx 和apache 服务做监控。
--modname 查看指定模块的运行状况,模块是指 tsar -L 列出来的名称 比如:tsar --cpu
$tsar -L
tsar enable follow modules:
cpu
mem
swap
tcp
udp
traffic
io
pcsw
partition
tcpx
load
查看多个模块的不同指定字段
$tsar --load --cpu -s runq,util
Time ---cpu-- ---load-
Time util runq
08/04/19-21:20 21.00 32.00
08/04/19-21:25 14.51 9.00
08/04/19-21:30 3.25 9.00
08/04/19-21:35 3.16 7.00
08/04/19-21:40 0.57 12.00
08/04/19-21:45 0.76 9.00
08/04/19-21:50 0.16 8.00
08/04/19-21:55 0.15 7.00
08/04/19-22:00 0.15 11.00
$tsar -l
Time ---cpu-- ---mem-- ---tcp-- -----traffic---- --sda--- --sdb--- ---load-
Time util util retran bytin bytout util util load1
08/04/19-21:27:18 0.27 30.66 0.00 4.0K 4.2K 0.00 0.00 0.13
08/04/19-21:27:23 0.06 30.66 0.00 438.00 1.2K 0.00 0.00 0.12
08/04/19-21:27:28 0.01 30.66 0.00 338.00 335.00 0.00 0.00 0.11
08/04/19-21:27:33 0.05 30.66 0.00 176.00 377.00 0.00 0.00 0.10
08/04/19-21:27:38 0.36 30.67 0.00 4.4K 5.1K 0.00 0.00 0.10
08/04/19-21:27:43 0.13 30.67 0.00 242.00 1.1K 0.00 0.00 0.09
08/04/19-21:27:48 0.42 30.66 0.00 4.0K 4.7K 0.00 0.00 0.08
08/04/19-21:27:53 0.04 30.66 0.00 418.00 962.00 0.00 0.00 0.08
08/04/19-21:27:58 0.09 30.66 0.00 1.0K 2.0K 0.00 0.02 0.07
08/04/19-21:28:03 0.29 30.66 0.00 358.00 4.1K 0.00 0.00 0.06
08/04/19-21:28:08 0.02 30.66 0.00 92.00 154.00 0.00 0.00 0.06
08/04/19-21:28:13 0.11 30.66 0.00 117.00 803.00 0.00 0.00 0.05
查看 指定模块的实时信息
$tsar -l --cpu
Time -----------------------cpu----------------------
Time user sys wait hirq sirq util
08/04/19-21:29:25 0.03 0.07 0.00 0.00 0.00 0.10
08/04/19-21:29:30 0.01 0.02 0.00 0.00 0.00 0.02
08/04/19-21:29:35 0.03 0.05 0.00 0.00 0.00 0.08
08/04/19-21:29:40 0.01 0.01 0.00 0.00 0.00 0.02
08/04/19-21:29:45 0.04 0.09 0.00 0.00 0.00 0.13
08/04/19-21:29:50 0.01 0.01 0.00 0.00 0.00 0.02
08/04/19-21:29:55 0.10 0.19 0.00 0.00 0.01 0.30
08/04/19-21:30:00 0.01 0.02 0.00 0.00 0.00 0.02
$tsar --io -I sdb -l
Time ------------------------------------------sdb-------------------------------------------
Time rrqms wrqms rs ws rsecs wsecs rqsize qusize await svctm util
08/04/19-21:59:01 0.00 0.00 0.00 2.8K 0.00 75.3K 26.77 0.00 0.05 0.02 7.00
08/04/19-21:59:06 0.00 0.00 0.20 2.8K 0.80 75.7K 26.82 0.00 0.05 0.02 7.10
08/04/19-21:59:11 0.00 0.00 0.00 2.8K 0.00 74.9K 26.83 0.00 0.05 0.02 6.84
08/04/19-21:59:16 0.00 0.00 0.00 1.4K 0.00 37.9K 26.29 0.00 0.05 0.02 3.66
以下两个命令式一个意思
$tsar --load -d 20190409
$tsar --load -d 1
Time -------------------load-----------------
Time load1 load5 load15 runq plit
08/04/19-00:05 2.73 2.89 2.41 3.00 7.3K
08/04/19-00:10 1.40 1.94 2.11 41.00 7.2K
08/04/19-00:15 1.61 1.68 1.95 1.00 7.2K
08/04/19-00:20 1.83 1.82 1.93 4.00 7.2K
08/04/19-00:25 1.92 1.89 1.92 1.00 7.2K
08/04/19-00:30 1.11 1.48 1.75 5.00 7.2K
08/04/19-00:35 1.36 1.40 1.63 2.00 7.2K
08/04/19-00:40 1.07 1.38 1.57 30.00 7.2K
08/04/19-00:45 1.30 1.26 1.45 1.00 7.2K
08/04/19-00:50 1.01 1.16 1.35 4.00 7.2K
08/04/19-00:55 1.26 1.10 1.26 2.00 7.2K
08/04/19-01:00 1.43 1.19 1.24 5.00 7.2K
08/04/19-01:05 1.17 1.16 1.21 16.00 7.2K
08/04/19-01:10 0.98 1.01 1.12 7.00 7.2K
08/04/19-01:15 0.79 0.95 1.07 2.00 7.2K
08/04/19-01:20 1.73 1.08 1.06 2.00 7.2K
08/04/19-01:25 1.41 1.37 1.19 2.00 7.2K
08/04/19-01:30 1.40 1.41 1.26 4.00 7.2K
08/04/19-01:35 1.51 1.41 1.29 1.00 7.2K
命令行加上-D 与不加上D的区别
$tsar --mem -D
Time -----------------------mem----------------------
Time free used buff cach total util
08/04/19-21:50 9325842432.00 86052364288.00 261754880.00 175354589184.00 270994550784.00 31.75
08/04/19-21:55 9324318720.00 86052917248.00 262361088.00 175354953728.00 270994550784.00 31.75
08/04/19-22:00 9352749056.00 86023622656.00 262938624.00 175355240448.00 270994550784.00 31.74
08/04/19-22:05 9323311104.00 86051930112.00 263589888.00 175355719680.00 270994550784.00 31.75
08/04/19-22:10 9320034304.00 86054137856.00 264204288.00 175356174336.00 270994550784.00 31.75
08/04/19-22:15 9321422848.00 86051889152.00 264806400.00 175356432384.00 270994550784.00 31.75
08/04/19-22:20 9316368384.00 86056013824.00 265383936.00 175356784640.00 270994550784.00 31.76
$tsar --mem
Time -----------------------mem----------------------
Time free used buff cach total util
08/04/19-21:50 8.7G 80.1G 249.6M 163.3G 252.4G 31.75
08/04/19-21:55 8.7G 80.1G 250.2M 163.3G 252.4G 31.75
08/04/19-22:00 8.7G 80.1G 250.8M 163.3G 252.4G 31.74
08/04/19-22:05 8.7G 80.1G 251.4M 163.3G 252.4G 31.75
08/04/19-22:10 8.7G 80.1G 252.0M 163.3G 252.4G 31.75
$tsar --partition -I /u01
Time --------------/u01--------------
Time bfree bused btotl util
19/09/14-15:20 1.9T 1.7T 3.8T 47.29
19/09/14-15:25 1.9T 1.7T 3.8T 47.29
19/09/14-15:30 1.9T 1.7T 3.8T 47.29
19/09/14-15:35 1.9T 1.7T 3.8T 47.29
19/09/14-15:40 1.9T 1.7T 3.8T 47.29
19/09/14-15:45 1.9T 1.7T 3.8T 47.29
比较常用的是查看系统网络是否丢包
tsar --tcp -s retran
查看磁盘io情况
tsar --io -I sdb -s await,util,qusize,rs,ws
查看主机负载
tsar --load