推荐-zabbix原理篇(1)

snmp介绍

介绍zabbix 之前让我们先来熟悉一下什么是snmp?

SNMP:Simple Network Management Protoclol

翻译一下:简单网络管理协议

SNMP的工作模式是啥?

  • NMS向agent采集数据
  • agent向NMS报告数据
  • NMS请求agent修改配置

SNMP组件:

  • MIB:management information base MIB就是snmp的监控对象,以及监控对象的属性(包括名称等)
  • SMI:MIB表示符号
  • SNMP协议

SNMP协议版本:

  • v1, v2, v3
  • v2c: NMS –> agent 加入了团体字的概念,目前用的比较多的版本。
  • v3: 认证、加密、解密

linux: net-snmp程序包

通过udp协议server监听在161端口,agent监听在162端口

监控流程

数据采集(数据超过阈值报警)→数据存储(存储时间序列数据形成实施监控曲线图)→数据展示

开源监控工具zabbix

zabbix功能很强大,如何理解zabbix的功能,我打算从cacti和nagios的功能讲起

cacti是一款数据采集,数据存储,外加web界面展示的工具,它负责阈值范围内的实时变化,但是对超过阈值的告警功能很薄弱

  • 优点:实时监控数据变化,以web页面的方式呈现,更直观。
  • 缺点:告警不及时

nagios是一款告警功能很强大的工具,它不关心阈值范围内的变化,只关心状态变化(超过阈值),然后报警。报警方式通过邮件,短信等。

  • 优点:告警反映迅速。
  • 缺点:监控主机数量有限,承载低

zabbix = cacti + nagios

  • 优点:基于两款工具优点于一身并更强大,实现企业级分布式监控。
  • 缺点:2.2版本带宽占用大但是升级到2.4版本后更节省了带宽资源,其它再无发现。

zabbix监控功能的实现

监控主机zabbix有专用的agent,可以监控Linux,Windows,FreeBSD等 。

监控网络设备zabbix通过SNMP,ssh(不多用)

可监控对象

  • 设备:服务器,路由器,交换机
  • 软件:OS,网络,应用程序
  • 主机性能指标监控
  • 故障监控: down机,服务不可用,主机不可达
  • IPMI(Intelligent Platform Management Interface)
    • 智慧平台管理接口(原本是一种Intel架构的企业系统的周边设备所采用的一种工业标准。IPMI亦是一个开放的免费标准,使用者无需支付额外的费用即可使用此标准。)

支持数据库存储类型

cacti: rrd (round robin database) 
abbix-database: MySQL, PGSQL(postgreSQL)、Oracle、DB2、SQLite

Zabbix架构中的组件

zabbix-server: C语言 OS: zabbix-agent: C语言 zabbix-web:GUI,用于实现zabbix设定和展示,PHP开发 zabbix-proxy: 分布式监控环境中的专用组件

Zabbix逻辑架构

定义一个template模板,里面包括多个items,trigger,graphs套用给host或者hostgroups。

server感情兴趣监控项目items通过zabbix。

poller进程(可以有多个进程实现并发处理)包括snmp,agent协议收集被监控主机信息。

如果阈值超过triggers触发器规定,就是形成一个events事件,然后actions处理动作(包括运行预先定制的脚本,不成功发送email或SMS)。

在服务器升级的时候提前设定maintenance维护模式不对服务器产生告警通知。

通过逻辑拓扑图展示工作流程

Zabbix Server启动后都有那些进程?

附:配置篇请看下回分解!

原文发布于微信公众号 - 马哥Linux运维(magedu-Linux)

原文发表时间:2016-04-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏架构师之路

58怎么玩数据库架构(upyun架构与运维大会速记)

大家好,我是58沈剑,今天我分享的主题是《58怎么玩数据库架构》,我的PPT页数非常少,讨论的问题非常的聚焦。 一、数据库的基本概念 基本概念就一页PPT,让大...

4309
来自专栏运维小白

Linux基础(day66)

19.1 Linux监控平台介绍 Linux监控平台介绍 监控存在的原因 站点出了问题,没有人知道,等用户发现了,才提醒供应商;对公司影响很大 常见开源监控软...

28810
来自专栏数据和云

【全局出发,追根溯源】一则集群故障案例分析

作者简介: ? 董冰,混迹DBA圈子十余载的闲云野鹤,曾服务过政府行业、银行数据中心、互联网游戏上市公司,辗转蛰伏于中国铁塔,励志做一个社会主义的螺丝钉。 故...

3606
来自专栏ImportSource

故障驱动的微服务架构设计

此文背景: 之所以发布此文,是有一个直接的原因,就是我们之前在线上遇到了一个使用timeout来判断是否失败的案例,这是真实的,结果就是效果很不好。看了本文中介...

5227
来自专栏CSDN技术头条

RebornDB:下一代分布式Key-Value数据库

现实世界有许多的Key-Value数据库,它们都被广泛应用于很多系统。比如,我们能够用Memcached数据库存储一个MySQL查询结果集给后续相同的查询使用,...

31310
来自专栏Java编程技术

分布式事务- TCC编程式模式

严格遵守ACID的分布式事务我们称为刚性事务,而遵循BASE理论(基本可用:在故障出现时保证核心功能可用,软状态:允许中间状态出现,最终一致性:不要求分布式事务...

1693
来自专栏王亚昌的专栏

vmstat命令详解与举例

[root@localhost ~]# vmstat -n 3       (每个3秒刷新一次) procs -----------memory-------...

861
来自专栏Python中文社区

一键获取免费真实的匿名代理

專 欄 ❈夏洛之枫,从销售转为程序员,Python爬虫爱好者。 github: https://github.com/ShichaoMa/proxy_fact...

2556
来自专栏钱塘大数据

【推荐收藏】33款可用来抓数据的开源爬虫软件工具

要玩大数据,没有数据怎么玩?这里推荐一些33款开源爬虫软件给大家。 爬虫,即网络爬虫,是一种自动获取网页内容的程序。是搜索引擎的重要组成部分,因此搜索引擎优化很...

6135
来自专栏王清培的专栏

RabbitMQ 高可用集群搭建及电商平台使用经验总结

面向EDA(事件驱动架构)的方式来设计你的消息 AMQP routing key的设计 RabbitMQ cluster搭建 Mirror queue poli...

71910

扫码关注云+社区

领取腾讯云代金券