专栏首页腾讯开源的专栏【开源公告】腾讯织云Metis智能运维学件平台正式开源

【开源公告】腾讯织云Metis智能运维学件平台正式开源

1

项目描述

“Metis”取名自希腊神话中的智慧女神墨提斯,全称为:腾讯织云 Metis 智能运维学件平台。“织云”指的是腾讯智能一体化运维平台,“学件”的概念由南京大学周志华教授提出。 学件 = 模型 + 规约,具有可重用、可演进、可了解的特性。在此基础上,腾讯云副总裁赵建春先生进一步提出“运维学件”的概念,亦称 AI 运维组建,强调其具备对运维场景智能化解决方案的记忆能力。 随着互联网业务的急剧膨胀和服务类型的多样化发展,人为指定规则的不足之处逐渐凸显,促使近两年来智能运维领域的高速发展。智能运维主张通过算法从海量运维数据中学习摸索规则,逐步降低对人指定规则的依赖,进而减少人为失误。 织云 Metis 是聚焦在智能运维的应用实践集合,它基于腾讯已有的运维数据,将机器学习领域的分类、聚类、回归、降维等算法和运维场景相结合,旨在通过一系列基于机器学习的算法,对运维数据进行分析、决策,从而实现自动化运维的更高阶段。

2

主要功能

  • 异常检测:提供率值检测和量值检测 API 接口,对时间序列进行检测,HTTP协议
  • 特征提取:提供三类特征(统计特征、拟合特征、分类特征)的提取功能,特征维度90+;支持增加自定义特征
  • 异常查询:经 API 检测后的时间序列(仅异常)入库存储,提供管理功能,分页查询、检索、放缩等
  • 标注打标:提供标注打标的功能,标记/取消标记为正负样本,标记后样本入样本库
  • 样本管理:提供样本管理功能,检索、图示、编辑、删除,导入等功能
  • 模型管理:提供模型管理功能,支持自定义模型训练

3

应用场景

  • 质量保障: 利用机器学习技术,进行异常检测、故障定位、瓶颈分析等,可在无人工干预下,智能地保障业务稳定运行。如无阈值智能监控、DLP 生死指标监控、多维根因分析。
  • 效率提升:基于自然语言处理、机器学习技术,进行智能问答、智能变更、智能决策,可显著提升运维效率。如 Metis 的智能咨询机器人、舆情监控、集群智能负载均衡、数据库参数调优、容量预测。
  • 成本管理:基于大数据智能分析技术,进行资源(设备、带宽、存储)管理,可迅速分析资源使用的明细,并通过横向大数据对比识别可优化点。如硬盘生命周期预测。本次 Metis 率先开源的无阈值智能监控学件,是从无监督+有监督学习的角度来解决时序数据的智能检测问题。

4

项目特性

  • 智能检测:运维人员不需要再去设置监控阈值,模型能够对异常情况做智能判决,直观告知检测结果是正常还是异常。通常而言,阈值的监控包含最值、同比、环比等维度设置,此检测方案在检测初期效果较好,但是随着业务发展和规模壮大,就会需要付出较高的人力成本去维护合适的阈值范围,对于大规模发展性业务得不偿失。智能检测的方案是基于统计判决、无监督和有监督学习对时序数据进行联合检测,通过统计判决、无监督算法进行首层判决,输出疑似异常,其次进行有监督模型判决,得到最终检测结果。这个过程就摒弃了阈值方式带来的问题。
  • 通用模型:智能检测的模型由腾讯织云多元化的海量业务样本训练而成,比较适合复用在互联网行业的时间序列检测中。有监督的检测效果取决于标注样本的准确性和种类丰富性,通过样本库管理功能积累了大量的正负样本、分为测试集和训练集,通用模型是经过海量训练集的样本数据训练而来,涵盖较全面的样本分类。可以帮助一些用户避免掉缺乏训练数据所带来的难点,用户可直接加载通用模型进行检测。
  • 规则学习:实践过程中也会遇到较个性的业务场景,千人千面,不同的用户对异常的判断标准也不尽一致,因此支持标注反馈功能,用户可根据标注信息进行训练,生成新的检测模型,进而掌握新的业务规则。

5

Metis 智能运维学件未来开源计划

Metis 将打造一个开放的学件平台,陆续开源时间序列指标预测、主机异常智能分析、MySQL 异常智能分析、硬盘生命周期预测等其它智能运维学件,集合广大用户在智能运维领域的建设经验和实践,丰富完善针对质量、效率、成本三个方面的AI学件,搭建完备的运维场景,并将在未来兼容其它监控领域的开源产品,如Zabbix、Nagios、Open-Falcon等。

腾讯织云 Metis 智能运维学件平台之无阈值智能监控学件正式开源

Github 开源地址:

https://github.com/Tencent/Metis (点击文末阅读原文直接访问)

请给 Metis 一个 Star !

欢迎提出你的 issue 和 PR!

Metis国内镜像地址:

https://git.code.tencent.com/Tencent_Open_Source/Metis

腾讯工蜂源码系统为开源开发者提供完整、最新的腾讯开源项目国内镜像

本文分享自微信公众号 - 腾讯开源(tencentopen)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-10-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Github开源项目贡献指南:创建开放的社区

    当你们建立了自己的社区,你需要考虑如何让那些处在漏斗上方的人(潜在用户)转移到漏斗下方(活跃的维护者)。你们的目标是减少贡献者们在每个阶段遇到的摩擦。当人们能够...

    腾讯开源
  • 【开源公告】腾讯Node.js基础设施TSW正式开源

    腾讯开源
  • Github 开源项目贡献指南:开源的法律问题

    向世界分享你们具有创造性的工作,这是一个多么令人激动和有价值的经历。这也意味着你们必须担心一堆你们不清楚的法律问题。幸运的是,你们不必从头开始。我们已经涵盖了你...

    腾讯开源
  • 【开源公告】腾讯织云Metis智能运维学件平台正式开源

    “Metis”取名自希腊神话中的智慧女神墨提斯,全称为:腾讯织云 Metis 智能运维学件平台。“织云”指的是腾讯智能一体化运维平台,“学件”的概念由南京大学周...

    DevOps时代
  • 【开源公告】腾讯织云Metis智能运维学件平台正式开源

    “Metis”取名自希腊神话中的智慧女神墨提斯,全称为:腾讯织云 Metis 智能运维学件平台。“织云”指的是腾讯智能一体化运维平台,“学件”的概念由南京大学周...

    织云平台团队
  • Java的三大版本含义及区别

    范围:J2SE 包含于 J2EE 中,J2ME 包含了 J2SE 的核心类,但新添加了一些专有类。

    bboy枫亭
  • 科学瞎想系列之一〇五 NVH那些事(10)

    【部分来自网络如有侵权敬请邮箱联系。欢迎原文转发到朋友圈,未经许可的媒体平台谢绝图片转载,如需转载或合作请邮件联系。联系邮箱laolicsiem@126.com...

    标准答案
  • Andrew Ng的机器学习课程概述(三)

    第十三章 无监督学习 首先讲的K-mean聚类原理还是挺简单的。就是你要分K个类,你就选择K个点做中心点,然后让所有的点进行计算,离哪个点最近,就选择成为这个点...

    用户1148523
  • PHP数据结构(十八) ——直接插入排序

    PHP数据结构(十八)——直接插入排序 (原创内容,转载请注明来源,谢谢) 一、概述 插入排序分为直接插入排序、其他插入排序、希尔排序。其他插入排序又分为折半...

    用户1327360
  • 性能专题:一文搞懂性能测试常见指标

    上周,对性能测试系列专题,在公号内发表了第一篇介绍:【性能系列连载一】开篇:性能测试不可不知的“干货”,但反响貌似并不太好,但既然此前已答应了部分读者要连载分享...

    测试开发技术

扫码关注云+社区

领取腾讯云代金券