系统监控工具 Tsar

Tsar是淘宝的一个用来收集服务器系统和应用信息的采集报告工具,如收集服务器的系统信息(cpu,mem等),以及应用数据(nginx、swift等),收集到的数据存储在服务器磁盘上,可以随时查询历史信息,也可以将数据发送到nagios报警。

Tsar能够比较方便地增加模块,只需要按照 tsar 的要求编写数据的采集函数和展现函数,就可以把自定义的模块加入到tsar中。

安装

Tsar目前托管在GitHub上,下载编译安装步骤:

[azureuser@mono tsar-master]$sudo wget -O tsar.zip https://github.com/alibaba/tsar/archive/master.zip --no-check-certificate

[azureuser@mono tsar-master]$ sudo unzip tsar.zip

[azureuser@mono tsar-master]$ cd tsar

[azureuser@mono tsar-master]$ sudo make

[azureuser@mono tsar-master]# sudo make install

  • 定时任务配置:/etc/cron.d/tsar,负责每分钟调用tsar执行采集任务;
  • 日志文件轮转配置:/etc/logrotate.d/tsar,每个月会把tsar的本地存储进行轮转;
  • Tsar配置文件路径:/etc/tsar/tsar.conf,tsar的采集模块和输出的具体配置;
  • 模块路径:/usr/local/tsar/modules,各个模块的动态库so文件;

Tsar配置

Tsar刚安装完,还没有历史数据,想要check是否正常,执行tsar -l,查看是否有实时信息输出:

[azureuser@mono tsar-master]$ tsar -l Time              ---cpu-- ---mem-- ---tcp-- -----traffic---- --sda--- --sdb---  ---load- Time                util     util   retran    pktin  pktout     util     util     load1 17/08/13-02:52:11   0.20    19.78     0.00     0.00    0.00     0.40     0.00      0.00

Tsar的配置主要都在/etc/tsar/tsar.conf中,常用的有:

  • 增加一个模块,添加 mod_<yourmodname> on 到配置文件中
  • 打开或者关闭一个模块,修改mod_<yourmodname> on/off
  • output_stdio_mod 能够配置执行tsar时的输出模块
  • output_file_path 采集到的数据默认保存到的文件(如果修改的话需要对应修改轮转的配置/etc/logrotate.d/tsar
  • output_interface 指定tsar的数据输出目的,默认file保存本地,nagios/db输出到监控中心/数据库中,这两个功能还需要结合其它配置

Tsar使用

  • 查看历史数据,tsar
  • -l/–list 查看可用的模块列表
  • -l/–live 查看实时数据,tsar -l –cpu
  • -i/–interval 指定间隔,历史,tsar -i 1 –cpu
  • –modname 指定模块,tsar –cpu
  • -s/–spec 指定字段,tsar –cpu -s sys,util
  • -d/–date 指定日期,YYYYMMDD或者n代表n天前
  • -C/–check 查看最后一次的采集数据
  • -d/–detail 能够指定查看主要字段还是模块的所有字段
  • -h/–help 帮助功能

高级功能

  • 输出到nagios

配置: 首先配置output_interface file,nagios,增加nagios输出

然后配置nagios服务器和端口,以及发送的间隔时间

####The IP address or the host running the NSCA daemon

server_addr nagios.server.com

####The port on which the daemon is running - default is 5667

server_port 8086

####The cycle of send alert to nagios

cycle_time 300

由于是nagios的被动监控模式,需要制定nsca的位置和配置文件位置

####nsca client program

send_nsca_cmd /usr/bin/send_nsca

send_nsca_conf /home/a/conf/amon/send_nsca.conf

接下来制定哪些模块和字段需要进行监控,一共四个阀值对应nagios中的不同报警级别

####tsar mod alert config file

####threshold [hostname.]servicename.key;w-min;w-max;c-min;cmax;

threshold cpu.util;50;60;70;80;

  • 输出到mysql

配置: 首先配置output_interface file,db,增加db输出

然后配置哪些模块数据需要输出

output_db_mod mod_cpu,mod_mem,mod_traffic,mod_load,mod_tcp,mod_udpmod_io

然后配置sql语句发送的目的地址和端口

output_db_addr console2:56677

目的地址在该端口监听tcp数据,并且把数据入库即可,可以参照tsar2db:https://github.com/kongjian/tsar2db

原文地址:http://blog.jobbole.com/38249/

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏电光石火

centos下完全卸载mysql

yum方式安装的mysql 1、yum remove mysql mysql-server mysql-libs compat-mysql51 2...

36350
来自专栏漫漫深度学习路

linux 非常用命令总结

如何删除ppa(我们在安装软件的时候,教程一般都会让添加ppa源,但是几乎没有教程会告诉你怎么删除) # 添加ppa源 sudo add-apt-reposit...

22250
来自专栏闵开慧

Java工程中添加依赖jar包不起作用问题总结

Java工程中添加依赖jar包不起作用问题总结 此次总结两种方式的依赖问题 1 在Eclipse中添加依赖jar包不起作用问题     这种方式可能是Eclip...

37470
来自专栏13blog.site

could not resolve host: github.com 问题解决办法

向github提交代码时出现问题,如图: ? 代码push失败,提示could not resolve host: github.com 解决办法: 1、打开终...

66950
来自专栏java架构师

Hadoop学习2--Linux准备及环境准备

1、环境安装: 虚拟机:VMware Player 系统:Ubuntu12 注意事项:注意位数,包括系统,java,Hadoop 2、切换账号 当前登录账号是自...

29960
来自专栏Python中文社区

每天一个Linux命令:chmod

格式 chmod [options] who operator permission file-list (符号模式) chmod [options] mode...

23460
来自专栏从零开始的linux

用shell添加用户

调试添加用户的脚本 # sh -x useradd.sh alex + '[' 1 -lt 1 ']' + id alex + useradd alex + ...

34760
来自专栏我的技术专栏

Java线程生命周期

19060
来自专栏深度学习之tensorflow实战篇

怎样设置虚拟机和主机文件共享

打开虚拟机,点击编辑虚拟机设置.如图: ? ubuntu默认root密码不可用,需要用普通用户登录后设置: 输入sudo passwd root ...

38560
来自专栏程序员的SOD蜜

基于邮件通道的WCF通信系统

WCF邮件通信系统,详细介绍请见 http://files.cnblogs.com/bluedoctor/WCF%e9%82%ae%e4%bb%b6%e9%80...

23160

扫码关注云+社区

领取腾讯云代金券