通过netstat命令,我们能获取TCP数据,监控它们有助于了解系统。
如果netstat版本比较老的话,那么运行时可能会遇到下面的错误信息:
error parsing /proc/net/netstat: Success
假设操作系统是CentOS,让我们看看如何确认netstat隶属于哪个软件包:
shell> rpm -qf $(which netstat)
net-tools-<VERSION>
如上所示,得知netstat属于net-tools软件包,通常升级它就可以修复错误了:
shell> yum update net-tools
在「netstat -s」中,TCP数据分为Tcp和TcpExt两部分,本文监控的是前者:
Tcp:
10549129725 active connections openings
10556220620 passive connection openings
28458277 failed connection attempts
3248285 connection resets received
234 connections established
289641890208 segments received
229159129140 segments send out
805264756 segments retransmited
1388430 bad segments received.
438683428 resets sent
既然是监控,直觉就是监控这些数据绝对值的变化情况,我最开始就是这么做的:定期把绝对值发送给Graphite,可惜最终出来的监控图基本是一条直线!为什么会这样?因为绝对值实在是太大了,大到浮动个几百几千的话,肉眼根本看不出来!此时绝对值意义不大,我们需要的是相对值的变化情况,如下代码可以在命令行下直接运行:
while true; do
netstat -s | grep -A 10 Tcp: | awk 'NR>1 {$1=$1; print}'
printf "\n"
sleep 1
done |
awk -v RS="" -v FS="\n" '{
for (i = 1; i <= NF; i++) {
VALUE = substr($i, 0, index($i, " ") - 1)
if (NR > 1) {
printf("%10d", VALUE - DATA[i])
}
DATA[i] = VALUE
}
if (NR > 1) {
printf("\n")
}
}'
太晚了,准备看片儿去了,细节问题我就不解释了,大家自己琢磨吧。