神州灵云BizTrace助力AIOps行业变革

人工智能和机器学习技术的发展,推动IT 运维向AIOps智能运维快速推进。特别是机器学习算法与基于大数据的业务运维管理平台整合,在告警过滤、异常监测、自动修复等环节发挥效用,让CIO和IT部门更专注于有价值的业务运维。

AIOps行业领域需求旺盛

根据Gartner 2017年8月对AIOps市场的调研发现,过去三年运维部门已陆续部署大数据和机器学习技术支持的IT运维平台;而后又迅速将这两种技术应用到服务台和自动化中。

同时,很多企业已经开始用AIOps平台增强应用性能管理、网络性能监控以及诊断工具,甚至开始替代传统APM和NPMD。(吓一跳,好在我们是新一代的)。

而IT运维供应商也开始通过收购或尝试开发新的运维平台来快速进入AIOps行业领域(我们是自己开发了)。

AIOps的人才稀缺也是大问题,目前企业正通过吸纳新科技领域的毕业生及行业人才补充弹药。

我们来看看AIOps到底是什么

通过下图可以清晰看到AIOps是利用机器学习和大数据技术将监控(可用性和性能)、服务台和自动化有机关联,实现可视化统计分析、模型自动发现、模型预测以及问题根源分析。

AIOps for Applications

根据2018年Gartner的市场定义,APM主要涵盖以下三个领域:

1.数字化体验监控(DEM):对移动端和浏览器端真实用户的可用性及性能监控、模型交易(即拨测)的可用性和性能监控。

2.应用发现、追踪和诊断(ADTD):应用拓扑发现和可视化,分布式交易追踪和应用结点的深度调用关系分析,这几个维度主要聚焦在问题修复和交互关联上。

3.智能应用运维(AIOps for Applications):自动发现性能和事件模式,探寻性能异常根源。

从定义中看到,在AIOps for Applications领域里,首先海量的应用交易通过模型自动发现错误异常、缓慢异常和失败异常,紧接着深究导致问题的具体程序、函数或者SQL语句,同时关联该运行结点的应用错误日志、计算和存储资源消耗统计数据,最终自动发现问题根源,再配合自动化工具,实现应用异常的发现、隔离和恢复。

机器学习+大数据+APM=AIOps

应用性能管理已经越来越重要,近几年逐步成为企业IT建设的刚需。而将机器学习,大数据融入到应用性能管理中,实现自动化和智能化,成为支撑AIOps不可或缺的部分。

谈到具体产品应用,神州灵云的BizTrace就是新一代的以业务为中心的智能应用性能管理平台,它有机地整合了插码探针AppTrace和旁路探针NPM,以业务的视角而不是应用监控数据或者网络监控数据的视角来呈现数据,从而更加贴近用户的场景和使用习惯BizTrace平台已经在AIOps中应用了非常多的产品功能:

1.业务模型

自动梳理业务请求,根据自动规则创建业务模型;同步应用层面的业务模型和网络数据包中的业务模型,从而在服务器程序视角和旁路数据包视角,双管齐下,同时对业务进行监控;

2.业务流程

用户可在业务模型的基础上,创建业务流程和业务组,然后再根据业务流程实现统计、跟踪和分布式追踪;

3.全文检索

可检索任意业务字段,业务流程、业务模型、业务步骤、调用链和调用树,最终定位到程序方法或者SQL语句。不仅如此,BizTrace还能调出出问题的原始数据包进行佐证;

4.服务拓扑

通过业务流程和业务组过滤,在服务拓扑中可以清晰了解服务之间的依赖关系,可以以拓扑方式或者表格方式进行呈现,也可以根据业务模型进行拓扑;此外,依托NPM的全量网络数据,还可以绘制出网络层面(包含负载均衡,防火墙等)路径拓扑;

5.微服务调用链

自动发现运行在容器中的微服务,从网关到后端服务的调用链条。链条上会显示每次调用的服务入参和出参,便于用户快速定位业务失败和故障;

6.异常事件关联,自动定位真实根源

例如,当用户端不能登录时,返回超时或者服务器错误,这时在服务器端会发现超时异常,在微服务程序中有极慢异常,通过它们之间的事件或者告警自动关联,提示用户真实原因是后台登录服务突然变得异常缓慢,而导致前端用户体验极速下降。

7.异构数据的自动关联和呈现

AIOps的一大特色就是能够把多源的异构数据进行关联分析(Correlation)。神州灵云在规则定义,模型适配的时候就已经做了插码探针和旁路探针的配置同步,并且预置了关联ID,从而生成的数据能够进行自动的关联。无论是网络报告的故障还是业务报告的故障,通过BizTrace平台都可以进行网络到应用调用或者是应用调用(代码)到网络的双向关联分析,大大缩短了平均故障修复时间(MTTR)。

AIOps已然成为运维未来趋势的一个重要方向,而应用性能管理的发展也影响着AIOps的不断进步。神州灵云的BizTrace也将在AIOps领域发挥更重要的作用。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180920G1M3YA00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券