专栏首页自动化运维运维架构服务监控Open-Falcon介绍
原创

运维架构服务监控Open-Falcon介绍

关于加我微信一起探讨运维工具,微信名为:lioyni,加我建群一起进步。

一、Open-Falcon介绍: 监控系统业界有很多杰出的开源监控系统。我们在早期,一直在用zabbix,不过随着业务的快速发展,以及互联网公司特有的一些需求,现有的开源的监控系统在性能、扩展性、和用户的使用效率方面,已经无法支撑了。因此,从各位SRE、SA、DEVS的使用经验和反馈出发,结合业界的一些大的互联网公司做监控,用监控的一些思考出发,设计开发了小米的监控系统:open-falcon。

二、特点: 1、强大灵活的数据采集:自动发现,支持falcon-agent、snmp、支持用户主动push、用户自定义插件支持、opentsdb data model like(timestamp、endpoint、metric、key-value tags)

2、水平扩展能力:支持每个周期上亿次的数据采集、告警判定、历史数据存储和查询

3、高效率的告警策略管理:高效的portal、支持策略模板、模板继承和覆盖、多种告警方式、支持callback调用

4、人性化的告警设置:最大告警次数、告警级别、告警恢复通知、告警暂停、不同时段不同阈值、支持维护周期

5、高效率的graph组件:单机支撑200万metric的上报、归档、存储(周期为1分钟)

6、高效的历史数据query组件:采用rrdtool的数据归档策略,秒级返回上百个metric一年的历史数据

7、dashboard:多维度的数据展示,用户自定义Screen

8、高可用:整个系统无核心单点,易运维,易部署,可水平扩展

9、开发语言: 整个系统的后端,全部golang编写,portal和dashboard使用python编写。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 运维架构服务监控Open-Falcon部署

    cd /tmp/ && git clone https://github.com/open-falcon/falcon-plus.git

    用户4580230
  • 024.Zabbix告警等级机制

    告警升级可以对告警结果按自定义的时间段进行进行消息发送,并执行命令,形成一个梯度的告警处理。

    木二
  • JAVA知识点总结篇(一)

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

    村雨遥
  • nyoj------布线问题(kruscal+求最小值)

    布线问题 时间限制:1000 ms  |  内存限制:65535 KB 难度:4 描述南阳理工学院要进行用电线路改造,现在校长要求设计师设计出一种布线方式,该布...

    Gxjun
  • 云原生混沌工程 - 增强Kubernetes应用容错性

    不管在将软件投入生产之前进行多么困难的测试以发现错误,错误总是会发生 - 云和可用区域会出现问题,网络会崩溃,是的,错误会让人感觉它们的存在。容错性(Resil...

    CNCF
  • thinkphp框架是什么

    前面有提到PHP的七大框架,接下来就来说说thinkphp框架,希望说的对大家有所帮助。不足的地方欢迎大家评论区指点,在此感谢。

    叫我可儿呀
  • 【答疑解惑】C语言里面如何计算数据类型取值范围?

    先看一个网友的问题: ? 初学者有不少会对数据类型的取值范围有疑问,数据类型的取值范围关系到定义合适的变量,尤其是在进行嵌入式开发时更要清楚。这里有必要介绍一下...

    程序员互动联盟
  • C语言第六讲,数组

              C语言第六讲,数组 一丶什么是数组 数组,就是一整块的连续内存空间. 且类型都是一样的.大小一样 比如: ? 1.1数组元素的访问 我们要访...

    IBinary
  • ELF动态链接强操作

    1: 48 89 e5 mov %rsp,%rbp

    jeff xie
  • 将数据中心迁移到云时易犯的10个错误

    从前不久的数据来看,虽然25%的企业还在评估云服务是否可以在日常生产环境中为他们工作,以及他们的公司数据在云中是否安全。 但是,对于云服务提供商存储和保护关键业...

    静一

扫码关注云+社区

领取腾讯云代金券