Loading [MathJax]/jax/output/CommonHTML/jax.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >基于 Go 语言开发的监控系统

基于 Go 语言开发的监控系统

作者头像
frank.
发布于 2022-10-28 02:33:11
发布于 2022-10-28 02:33:11
1.2K00
代码可运行
举报
运行总次数:0
代码可运行

01

介绍

小米开源的监控系统 open-falcon 和滴滴开源的日志采集工具 falcon-log-agent 作为一组黄金搭档,被互联网公司广泛使用。

本文介绍怎么使用这组黄金搭档监控业务系统的日志。

02

open-falcon

open-falcon 使用 Golang 和 Python 开发,其中 Python 主要开发的是 Dashboard。

限于篇幅,本文不准备介绍 open-falcon 的原理,仅介绍如何安装。

安装 open-falcon 之前,必须确保已成功安装 RedisMySQL,因为 open-falcon 需要使用这两个存储组件。

同时,我们还需要确保已成功安装 Golang 和 Python。

需要注意的是,我们还需要确保已设置 GOROOT 环境变量(也可以使用默认值)。

安装 open-falcon :

下载源码和初始化数据库

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
mkdir -p $GOPATH/src/github.com/open-falcon
cd $GOPATH/src/github.com/open-falcon
git clone https://github.com/open-falcon/falcon-plus.git
cd $GOPATH/src/github.com/open-falcon/falcon-plus/scripts/mysql/db_schema/
# 初始化数据库
mysql -h 127.0.0.1 -u root -p < 1_uic-db-schema.sql
mysql -h 127.0.0.1 -u root -p < 2_portal-db-schema.sql
mysql -h 127.0.0.1 -u root -p < 3_dashboard-db-schema.sql
mysql -h 127.0.0.1 -u root -p < 4_graph-db-schema.sql
mysql -h 127.0.0.1 -u root -p < 5_alarms-db-schema.sql

编译

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd $GOPATH/src/github.com/open-falcon/falcon-plus/

# make all modules
make all

# make specified module
make agent

# pack all modules
make pack

在执行 make pack 之后,我们得到一个压缩包 open-falcon-vx.x.x.tar.gz

如果我们想要修改每个模块的配置文件,在执行 make pack 之前,我们可以修改模块的 config/xxx.json

需要注意的是,模块的配置文件中,MySQL 的账号和密码,默认分别是 root 和空,如果我们的 MySQL 账号和密码与之不同,我们需要编辑模块的配置文件进行修改。

部署

我们可以将得到的压缩包解压缩到指定目录进行部署,例如:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
make ~/open-falcon
tar -zxvf open-falcon-vx.x.x.tar.gz -C ~/open-falcon

启动所有模块

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd ~/open-falcon
./open-falcon start

# 检查模块状态
./open-falcon check

安装仪表盘

在安装 Dashboard 之前,我们需要先安装依赖项:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# Centos
yum install -y python-virtualenv
yum install -y python-devel
yum install -y openldap-devel
yum install -y mysql-devel
yum groupinstall "Development tools"

# Ubuntu
apt-get install -y python-virtualenv
apt-get install -y slapd ldap-utils
apt-get install -y libmysqld-dev
apt-get install -y build-essential
apt-get install -y python-dev libldap2-dev libsasl2-dev libssl-dev

安装 Dashboard:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd ~/open-falcon
git clone https://github.com/open-falcon/dashboard.git
cd dashboard
virtualenv ./env
./env/bin/pip install -r pip_requirements.txt

需要注意的是,这里有一个 Bug,会导致无法在仪表盘注册账号(点击按钮无反应),需要将 falcon api 的端口号 18080 改为 8080

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd ~/open-falcon/dashboard
vim rrd/config.py
# 端口 18080 改为 8080
API_ADDR = os.environ.get("API_ADDR","http://81.70.201.193:8080/api/v1")

在启动 Dashboard 之前,我们再检查一下 open-falcon 的 api 模块是否已启动:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd ~/open-falcon
./open-falcon check

启动 Dashboard:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
$ cd ~/open-falcon/dashboard
$ ./control start

在浏览器中,打开 http://127.0.0.1:8081

03

falcon-log-agent

falcon-log-agent 不同于 ELK,它不是日志查看系统,而是日志计算系统。

它通过外挂式的日志采集方式,实时读取日志文件中的内容,实时计算,并将计算结果直接推送到 open-falcon。

它有几个限定条件,分别是要求日志必须包含时间,不支持文件软链接,日志时间必须有序。

安装 falcon-log-agent:

构建

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
make -p $GOPATH/src/github.com/didi && cd $_
git clone https://github.com/didi/falcon-log-agent.git
make build

修改配置文件

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd $GOPATH/src/github.com/didi/falcon-log-agent
cp cfg/dev.cfg cfg/cfg.json # 基础配置
cp cfg/strategy.dev.json cfg/strategy.json # 策略配置

部署

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd $GOPATH/src/github.com/didi/falcon-log-agent
make pack
mkdir ~/open-falcon/falcon-log-agent
tar -zxvf falcon-log-agent.tar.gz -C ~/open-falcon/falcon-log-agent

启动

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd ~/open-falcon/falcon-log-agent
./control start

检查

  • http://ip:8003/health 健康检查
  • http://ip:8003/strategt 查看生效策略

策略配置示例:

本文以 open-falcon 的 agent 模块的日志为例,介绍怎么配置一个新策略。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[
    {
        "id":10, # 多个策略,id 必须唯一
        "name":"agent send data count", # 对应 open-falcon 中的 metric(监控项)
        "file_path":"/root/open-falcon/agent/logs/agent.log", # 日志路径(支持动态路径)
        "time_format":"yyyy/mm/dd HH:MM:SS", # 时间格式
        "pattern":"Total=(\\d+)", # 匹配正则表达式
        "exclude":"", # 排除正则表达式
        "step":60, # 日志采集周期,单位秒
        "tags":{}, 对应 open-falcon 中的 tag
        "func":"cnt", # 日志采集方式,cnt、avg、sum、max、min
        "degree":6, # 精度
        "comment":"", # 备注
        "parse_succ":true
    }
]

重启 falcon-log-agent,我们在 Dashboard 中的 Couters 列表中可以看到 agent send data count

04

监控配置

我们介绍完 open-falcon 和 falcon-log-agent 的安装和启动。

已实现自动采集日志并将计算数据上报到 open-falcon,接下来,我们介绍针对日志数据怎么配置监控。

监控配置操作步骤:

  1. 创建用户组。
  2. 创建模板。
  3. 添加策略,其中 metric 对应 falcon-log-agent 策略配置文件中配置项的 name,max 是最大报警次数,P 是报警级别(<3:既发短信也发邮件,>=3:只发邮件),run 是策略生效时间(不填写代表全天生效),if 代表条件。 告警条件支持函数如下:
    • all(#3) 最新 3 个点都满足阈值条件则报警。
    • max(#3) 最新 3 个点,最大值满足阈值条件则报警。
    • min(#3) 最新 3 个点,最小值满足阈值条件则报警。
    • sum(#3) 最新 3 个点,其和满足阈值条件则报警。
    • avg(#3) 最新 3 个点,其平均值满足阈值条件则报警。
    • diff(#3) 将最新 push 过来的点(被减数),与历史最新 3 个点(减数)相减,得到 3 个差,有一个差满足阈值条件则报警。
    • pdiff(#3) 将最新 push 过来的点(被减数),与历史最新 3 个点(减数)相减,得到 3 个差,再将 3 个差值分别除以减数,得到 3 个商值,有一个商值满足阈值条件则报警。
    • lookup(#2,3) 最新的 3 个点中有 2 个满足阈值条件则报警。
  4. 配置报警接收用户组。

05

总结

本文我们介绍了基于 Go 语言开发的开源监控系统和日志采集工具的安装和使用方式。

建议读者朋友们动手操作一遍,需要注意的是,尽量严格按照本文的目录结构操作。

推荐阅读:

  1. Go 语言内存逃逸案例
  2. Golang 语言 vendor 在 GOPATH 和 Modules 中的区别
  3. Golang 语言中基础同步原语 Mutex 和 RWMutex 的区别
  4. Golang 语言中的非类型安全指针
  5. Golang 语言怎么实现访问流量限流?

参考资料:

  1. https://github.com/open-falcon/falcon-plus
  2. https://github.com/open-falcon/dashboard
  3. https://github.com/didi/falcon-log-agent
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-09-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Go语言开发栈 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
大数据平台建设 —— 监控预警组件之OpenFalcon + Grafana
由于Redis和MySQL部署在其他机器上,所以需要修改一下这两个组件的连接信息。编辑open-falcon api模块的配置文件:
端碗吹水
2020/11/19
2.8K0
大数据平台建设 —— 监控预警组件之OpenFalcon + Grafana
002.Open-Falcon Server部署及Agent监控
Open-Falcon,为前后端分离的架构,包含backend 和 frontend两部分:
木二
2019/07/26
1.1K0
CentOS7下部署Open-Falcon小米开源监控系统
1、强大灵活的数据采集:自动发现,支持falcon-agent、snmp、支持用户主动push、用户自定义插件支持、opentsdb data model like(timestamp、endpoint、metric、key-value tags)
yuanfan2012
2020/06/01
1.6K0
CentOS7下部署Open-Falcon小米开源监控系统
分布式监控-open-falcon
操作系统:centos7(minimal,www.centos.org下载的包是CentOS-7-x86_64-Minimal-1611.iso)
yaohong
2019/09/11
7100
分布式监控-open-falcon
CentOS 6.5下Open-Falcon监控系统的部署
注:本次安装为测试环境,使用CentOS 6.5的系统,所装软件均为直接yum,如果线上部署,请使用公司提供的软件版本
星哥玩云
2022/07/25
8420
01 . Openfalcon小米监控简介及部署
2.Transfer http:6060 rpc:8433 socket:4444
iginkgo18
2020/09/27
5.1K0
01 . Openfalcon小米监控简介及部署
open-falcon环境准备
下载rpm包:https://dev.mysql.com/downloads/repo/yum/
dogfei
2020/07/31
4410
Open-Falcon监控系统部署
数据库连接的配置格式是: username:password@tcp(path:port)/xxxx
Jintao Zhang
2018/08/27
1.3K0
Open-Falcon监控系统部署
运维架构服务监控Open-Falcon部署
cd /tmp/ && git clone https://github.com/open-falcon/falcon-plus.git
用户4580230
2019/12/06
5830
小米的开源监控系统open-falcon架构设计,看完明白如何设计一个好的系统
早期,一直在用zabbix,不过随着业务的快速发展,以及互联网公司特有的一些需求,现有的开源的监控系统在性能、扩展性、和用户的使用效率方面,已经无法支撑了。
Java架构师必看
2021/07/12
7.7K0
openfalcon架构及相关服务配置详解
  agent内置了一个http接口,会自动采集预先定义的各种采集项,每隔60秒,push到transfer。
yaohong
2019/08/21
1.4K0
openfalcon架构及相关服务配置详解
滴滴开源夜莺Nightingale:企业级监控解决方案「建议收藏」
导读:滴滴开源又双叒发布新开源项目啦——夜莺(Nightingale)是滴滴基础平台联合滴滴云研发和开源的企业级监控解决方案。旨在满足云原生时代企业级的监控需求。一起来了解项目详情吧。
全栈程序员站长
2022/09/05
1.6K0
滴滴开源夜莺Nightingale:企业级监控解决方案「建议收藏」
open-falcon部署前端和后端
dashbord没有默认创建任何账号包括管理账号,需要你通过页面进行注册账号。 想拥有管理全局的超级管理员账号,需要手动注册用户名为root的账号(第一个帐号名称为root的用户会被自动设置为超级管理员)。 超级管理员可以给普通用户分配权限管理。 小提示:注册账号能够被任何打开dashboard页面的人注册,所以当给相关的人注册完账号后,需要去关闭注册账号功能。只需要去修改api组件的配置文件cfg.json,将signup_disable配置项修改为true,重启api即可。当需要给人开账号的时候,再将配置选项改回去,用完再关掉即可。
dogfei
2020/07/31
1.8K3
运维架构服务监控 Open-Falcon
李鹏
2017/10/18
2.3K0
Mt-Falcon——Open-Falcon在美团点评的应用与实践
前言 监控系统是整个业务系统中至关重要的一环,它就像眼睛一样,时刻监测机房、网络、服务器、应用等运行情况,并且在出现问题时能够及时做出相应处理。 美团点评刚开始使用的是Zabbix监控系统,几经优化,在当时能够达到2W+机器,450W+监控项的量。随着各业务线的发展,监控项越来越多,Zabbix的问题也越来越突出,当时针对Zabbix的吐槽问题有: 不支持扩展,本身是一个单点,当机器规模超过万台的时候会出现很明显的性能问题。 改造难度比较大,不支持定制化功能。 配置比较复杂,学习成本较高。 对外提供的API
美团技术团队
2018/03/12
2.4K0
Mt-Falcon——Open-Falcon在美团点评的应用与实践
服务器状态监控工具Open Falcon 使用教程
OpenFalcon是一款企业级、高可用、可扩展的开源监控解决方案,提供实时报警、数据监控等功能。可以非常容易的监控整个服务器的状态,比如磁盘空间,端口存活,网络流量等等。
沈宥
2022/05/10
2.2K0
服务器状态监控工具Open Falcon 使用教程
CentOS7下部署滴滴云开源运维监控系统-Nightingale
Nightingale是滴滴基础平台联合滴滴云研发和开源的企业级监控解决方案。旨在满足云原生时代企业级的监控需求。
yuanfan2012
2020/06/04
2.5K0
CentOS7下部署滴滴云开源运维监控系统-Nightingale
MySQL监控脚本
mymon下载地址:GitHub - open-falcon/mymon: MySQL Monitor Script
用户1148526
2022/04/13
1.9K0
监控系统选型,这篇不可不读!
目前我所经历的几家公司,监控系统都是自研的。其实业界有很多优秀的开源产品可供选择,能满足绝大部分的监控需求,如果能从中选择一款满足企业当下的诉求,显然最省时省力。
码哥字节
2020/09/24
2.8K0
监控系统选型,这篇不可不读!
监控系统选型,一篇全搞定!
这篇文章,我将对监控体系的基础知识、原理和架构做一次系统性整理,同时还会对几款最常用的开源监控产品做下介绍,以便大家选型时参考。内容包括3部分:
爱撒谎的男孩
2023/01/04
1.8K0
相关推荐
大数据平台建设 —— 监控预警组件之OpenFalcon + Grafana
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验