【活动】腾讯运维总监带你探索 AIOps

腾讯运维十年,最重要的一件事情就是建立规则和次序。

这其中的过程可以分成几个阶段,包括:交付->组件->架构->监控;而这两年最重要的事情就是智能化。

交付

交付:在腾讯SNG可以认为十年前运维主导了交付标准,PKG包管理、CMDB配置管理、CC配置管理、ARS发布等一些列交付标准被严格执行,确保了十年来的研发和运维的效率与质量。而大家经常听到的自动化运维无非是标准交付的一种技术实现。

组件

第二个质的飞跃是组件的规范,简单理解很像2000年前的“书同文、车同轨”,一个业务进入规模化甚至海量后,这点是必然之路。

架构

近些年火灾灾害比过去少了很多很多,我认为是更加重视灾害的危险而加大了在城市建设阶段的消防考虑和要求。而作为救火队员的运维在产品业务建设初期参与架构规划也是减少后期运维灾难的重要手段。15年“天津大爆炸”事件,腾讯运维在无感知的情况下将7000万QQ用户迁移出天津机房,就是运维参与架构建设带来的业务能力提升。这也是运维建设的最重要的阶段之一,也是持续时间最常的一个阶段。

监控

贯穿运维建设全程而不算一个阶段,之所以放做一个阶段是因为这几年的大数据和机器学习让监控成为了运维技术的新方向。监控上的飞跃让整个运维技术上了一个新的阶段。

智能化

运维本来就是在解决各种场景下的问题,智能化技术是一些新手段帮助运维解决过去解决不了的问题,我认为能利用好这个技术手段解决问题的就算是智能运维了。在这个领域我们比较早就开始探索,较早的可以追溯到12年左右。比如:ROOT:基于业务架构的链路关联算法;DLP:业务核心生死指标;大数据:通过机器有监督学习的方式来优化告警;全链路:利用海量数据关系来拓展纬度。

AIOps 并非万能,但它的的确确能让运维彻底脱离重复低效的手工作坊式的工作。从运维升级成技术运营,因此焕发第二春。

腾讯在智能运维应用上有哪些套路和高招?

作为一名伴随腾讯十年的运维老兵,腾讯运维总监聂鑫有话对你说...

个人简介:

从开发到运维,伴随腾讯社交网络运营部成长的十年,负责过腾讯社交产品所有业务运维工作。目前主要负责 QQ、空间等产品运维团队管理工作。经历多个业务产品的诞生到蓬勃,伴随着运维团队的成长和成熟,见证着腾讯一代代运营技术的创新和发展。作为运维界老兵有好多故事想和大家讲,也特别愿意听听各位经历的酸甜苦辣。

2018年5月26日,高效运维 AIOps 北京沙龙,腾讯运维总监聂鑫老师将来到现场,并分享腾讯在智能运维领域的实践经验。

除此之外,另一位来自京东的老师:张晨@京东金融 资深研发工程师也将带来演讲《 智能运维之异常检测与根因分析 》

主题简介:

智能运维的应用在运维监控中的应用。在运维监控系统中,每时每刻会产生大量应用监控数据,日志数据,主机数据,网络数据,如何识别出这些信息那些是有问题,如何排除一些干扰信息,发送出准确的报警。有了异常检测所产生的异常报警数据,又如何找到这些数据之间的关联,找到产生问题的最根本原因,准确的定位,其实一次数据库访问的失败可能是由于交换机问题引起。

个人简介:

目前任职京东金融,曾任职于搜狐畅游等互联网公司,擅长Java底层技术的研发及疑难问题的定位。从2015年开始从事智能运维监控平台的研发与实践,参与并主导了APM等产品的研发与应用,经历了多次618和双11的千万级TPS的运维保障,支撑了京东金融的大量业务应用。

活动通知

扫码参与报名

原文发布于微信公众号 - 腾讯织云(TencentCOC)

原文发表时间:2018-05-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏无原型不设计

10个实用的UX设计作品推销小窍门

? 众所周知,产品用户体验很重要,即使是Google也知道这一点。但是,当真正涉及到UX 设计销售时, 往往会让人觉得似乎并没有人认识到其重要性。因为,当我们...

37170
来自专栏ThoughtWorks

一场国际水准的技术大会,一次领域驱动设计(DDD)实践者们的狂欢!

架构是为了解决业务问题而产生的,没有了业务,架构就没有了存在的前提!在解决同一个业务问题的前提下,更高效更低成本的架构,会淘汰低效高成本的架构。DDD让架构更高...

16830
来自专栏杨熹的专栏

《斯坦福大学人生设计课》-你希望你的人生是工业品,还是艺术品?

这本书吸引我的是它的名字叫做人生设计,我们通常都是知道人生规划这个词,而设计相比于规划来讲,给我一种更自由更浪漫的感觉,让我非常想要进去读一下人生到底应该如何设...

20920
来自专栏无原型不设计

10个实用的UX设计作品推销小窍门

以下内容由Mockplus(摹客)团队翻译整理,仅供学习交流,Mockplus是更快更简单的原型设计工具。

1.6K70
来自专栏腾讯大讲堂的专栏

运维汪转向产品狗的幸(dan)福(teng)之路

写这篇文章的初衷是想总结下自己从业务运维岗转到产品经理岗后,大半年来如何从“零”开始的一路摸爬打过来的经历。

49180
来自专栏云计算D1net

微软的云服务将渗透到各个领域

现在关注的热点是智能穿戴的设备,还有一个是车联网,在这样新兴领域微软有怎样的计划和打算?古德华表示,微软非常希望引领全球计算方面领域的发展,包括智能设备,智能设...

37560
来自专栏芋道源码1024

闲话如何成为一个架构师

停了很久,继续上路。计划写一个系列,先预告:《如何成为架构师》,《如何做一名好开发》,《如何做系分》,《如何转型技术管理》。

17920
来自专栏Java帮帮-微信公众号-技术文章全总结

项目管理——产品开发各角色职能及技能要求

项目管理——产品开发各角色职能及技能要求 PDT经理(LPDT) 职责说明 定义项目研发过程,组建项目团队并明确职责,定义项目研发过程的度量指标; 主导制定并...

35650
来自专栏人工智能的秘密

知识图谱技术已发展得相对成熟,未来的探索方向在哪

前段时间被沙特阿拉伯授予公民身份的人形机器人“索菲亚”,再一次颠覆了人们对人工智能技术的认知。“索菲亚”多次与人类交锋并公开发表言论的过程中,我们感受到了基本的...

62660
来自专栏华章科技

成功实施BI项目的四大要素

其实所谓“要素”不一定是项目执行过程中的关键点,这其中也包含了执行人的要素,毕竟所有项目的实施都是以人为发起点,然后以事件作为驱动,所以项目中最难把控的就是人的...

16720

扫码关注云+社区

领取腾讯云代金券