前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >主动做了业务监控,产品经理对我竖起大拇指

主动做了业务监控,产品经理对我竖起大拇指

作者头像
猿天地
发布2021-03-12 14:51:39
2720
发布2021-03-12 14:51:39
举报
文章被收录于专栏:猿天地猿天地

监控,一直是个可以聊很久的话题。除了系统监控,还有一个往往容易被忽略,今天我们就来聊聊这个容易忽略的业务监控。

监控什么?

作为开发人员,不仅仅是把功能开发出来就行了,对于你负责的产品或者模块,你需要对它有足够的了解,时时刻刻需要关注着,要有初恋的那种感觉才行。

以电商最常见的下单功能来说,比如我想知道下单的成功率多少,下单的平均耗时,下单失败中有多少是因为库存不足下单失败的等等这类相关的信息。

有了这些业务指标信息,你就能知道你负责的产品现状是什么样的,以及你需要做哪些改进。

至于要监控哪些指标,得跟着你的业务走。目的很明确,就是需要知道业务的状况,并在某些时候能够触发告警。

实现方式

基于埋点的方式来进行数据的记录,记录到本地磁盘文件中,然后通过统一的日志收集程序收集存储,统计展示以及告警。

之所以基于埋点的方式实现是因为需要知道每个业务接口的执行结果,成功还是失败,失败的原因是什么。我们对于每个异常都定义了业务码,可以根据业务码知道异常原因。

如果用写日志的方式输出数据,记得将业务日志的数据文件单独出来,不要和系统的日志输出在一起,否则不好收集解析。

用logback可以单独配置一个appender,我这边只输出了我埋点的业务数据,Json格式的。

代码语言:javascript
复制
<appender name="BIZ_FILE_APPENDER" class="ch.qos.logback.core.rolling.RollingFileAppender">
    <encoder>
        <pattern>%m%n${LOG_EXCEPTION_CONVERSION_WORD:-%wEx}</pattern>
    </encoder>
    <rollingPolicy class="ch.qos.logback.core.rolling.TimeBasedRollingPolicy">
        <FileNamePattern>${LOG_HOME_PATH_BIZ}/${APP_NAME}.%d{yyyy-MM-dd}.log</FileNamePattern>
        <MaxHistory>7</MaxHistory>
    </rollingPolicy>
    <filter class="ch.qos.logback.classic.filter.LevelFilter">
        <onMatch>ACCEPT</onMatch>
        <onMismatch>DENY</onMismatch>
    </filter>
</appender>

日志文件内容:

代码语言:javascript
复制
{"biz":"confirm","bizCode":500,"domain":"storeOrder","bizId":"86081301","execTime":3,"count":"1","storeId":"1","userId":"740942"}
{"biz":"confirm","bizCode":500,"domain":"storeOrder","bizId":"86081301","errorMessage":"/ by zero","execTime":14,"count":"1","storeId":"1","userId":"740942"}

注解埋点

BizLog注解用于业务监控埋点,里面具体配置字段说明如下:

  • domain: 领域,比如 order,pay
  • biz: 业务,比如 createOrder,cancelOrder
  • bizId: 业务ID,比如 orderId
  • addition: 扩展信息

addition可以配置多个additionField获取想要埋点的数据,数据可以从请求参数中获取,也可以从相应参数中获取,比如订单创建成功后,会返回订单ID, 那么bizId就是从响应参数中获取。

代码埋点

某些场景(支付回调,JOB任务等)下不太好通过注解方式埋点我们可以采用代码埋点的方式来实现。

日志收集

我们用的是阿里云的日志服务,直接配置logtail即可完成收集工作,界面操作,非常方便。

指标展示

埋点原始数据

图表统计展示

指标告警

数据都收集上来了,想要关注哪些指标,想要在什么时候告警,就变得很容易了。比如说某分钟内下单频繁失败,这个时候你就可以配置告警失败次数>N 触发告警,当收到告警时,就马上去排查为什么会下单失败了。

- END -

代码语言:javascript
复制
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-03-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 猿天地 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 监控什么?
  • 实现方式
  • 注解埋点
  • 代码埋点
  • 日志收集
  • 指标展示
    • 埋点原始数据
      • 图表统计展示
      • 指标告警
      相关产品与服务
      应用性能监控
      应用性能监控(Application Performance Management,APM)是一款应用性能管理平台,基于实时多语言应用探针全量采集技术,为您提供分布式性能分析和故障自检能力。APM 协助您在复杂的业务系统里快速定位性能问题,降低 MTTR(平均故障恢复时间),实时了解并追踪应用性能,提升用户体验。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档