AIops离我们遥远吗?

如果在几年前说这个话题,可能会很容易被打脸,打得啪啪响。

DevOps都玩不好还想玩AIOps?

所以我们要推进DevOps的理念,会受到两个方向的阻力,比如运维和开发团队的支持,或者说是上下级同事的支持。

很多同事说,这么高大上的事情可以先放一放,我们手里的业务都忙不完,哪里有时间去折腾这个事情。当然这是一个死循环,越是没有时间,越是没有改进,然后继续按部就班。

自动化运维不等于devops,但是自动化运维做不好,devops一定做不好。而要做自动化,一定要做标准化,标准不是一个文档,或者一纸空文,而是可以落实的流程,流程是一把针,能够有效的把这些标准(线)连接起来。

当然说到AIops的标准,似乎行业里对于它的定义有很多不同的声音,在这方面,对于BAT大厂的思想进行提取和借鉴就是一个不错的行径。我们没法照搬,但是可以做一些取舍和定制。

其实在我们的工作中,很多同学按部就班的处理问题,最终的目标是解决问题。这个问题的来源相对来说是被动的,就好比是一个篮子,需求就是一些小球,篮子里面永远都有填不完小球。我们可以换个思路,为什么会出现这个问题,如果觉得这个问题太弱智,我们先放一下,然后我们分析这个问题的根本原因是什么,对此的输出就是解决方案,最终问题得到解决。

然后回过头来继续看第一个问题,为什么会出现这个问题,如果追根溯源,一定能够找到很多相关的因素或者同类潜在的问题。那么这个发现问题的角度就是一种主动,系统化的方法论了。

而对于分析问题,这个就是解决问题的核心了,很多时候我们都会依赖于人,高手和新手对于同样一个问题的处理思路大大不同,而且同样的输出和日志,在他们眼里的含义和角度也不同,所以分析问题的角度和细节决定了分析问题的质量。在这个阶段其实我们是很依赖于个人的,最终我们需要得到一格解决方案。

而真正的解决问题,其实是在前面思考的前提下来做的实施。

为什么很多时候业务同学反馈说存在代沟或者不便捷的很多方面,一个原因是因为我们前两个步骤做的不够好,我们没有提前发现问题,而是更多等待业务的反馈,业务一旦反馈,那么肯定没有太小的事情。如果发现了问题A,同时我们能够发现问题B,问题C,这样对于业务同学来说,系统的可用性会大大提高。至于发现过多问题导致的业务价值的过渡透明化,这是另外一个极端了。

对于问题分析,最终的一个产出是解决方案,比如业务同学想要一个 结果A,结果你像哆啦A梦般有一揽子的解决方案,对于哪一种解决方案都能够灵活应对,那么我们业务同学对你的信任感会大大提高,在后续的工作中会有更多愉快的合作。

否则基本就会是人海战术。

如果按照行业的一个基本标准来说:AIOps 不依赖于人为指定规则,主张由机器学习算法自动地从海量运维数据(包括事件本身以及运维人员的人工处理日志)中不断地学习,不断地提炼并总结规则。

这对于很多运维人员或者运维开发人员来说,我们需要做的事情就更加专精深了。这势必会是一个全新的方向,同时也是一种全新的思路借鉴。

我翻了下今年关于AIops的一些目标,大体有如下的一些阶段和程度吧。

1)开始尝试应用AI能力,还无较成熟单点应用

2)具备单场景的AI运维能力,可以初步形成供内部使用的学件

3)有由多个单场景AI运维模块串联起来的流程化AI运维能力,可以对外提供可靠的运维AI学件

4)主要运维场景均已实现流程化免干预AI运维能力,可以对外提供可靠的AIOps服务。

5) 有核心中枢AI,可以在成本、质量、效率间从容调整,达到业务不同生命周期

所以要高度的自动化,智能化,有一大堆的事情要做好,要提前安排。

这是一个相对概览的图,可以对标。

很多同学都说我们最好了自动化运维的工作,是不是工作已经走到头了,显然说实话,才是刚刚开始。后续有一大堆的事情需要我们来做。

对于AIops的落地,自己也有了一个初步的思路,后期在工作中会更加强化API接口层的独立性,然后不断的封装,满足业务需求之外,还可以提供更加深度的技术支持。

想想,我们的工作依旧任重道远,我们自身的意识也需要从1.0提升到2.0

原文发布于微信公众号 - 杨建荣的学习笔记(jianrong-notes)

原文发表时间:2018-07-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ThoughtWorks

项目管理中的敏捷实践|洞见

作为项目经理,我们经历了不同的项目,却总是受限于相似的困局。比如以下三个典型难题: 团队目标不一致 团队成员不熟悉 信息发布不流畅 倘若我们任由问题存在,而不...

3955
来自专栏悦思悦读

大型IT企业内部数据分析的现状和发展趋势

大数据时代,数据已经成为战略资源。掌握前沿科技的大型IT企业在数据的分析和利用上走在了时代的前列。笔者浸淫IT业十余年,近几年专注在数据分析平台研发和数据分析上...

35712
来自专栏罗超频道

《小时代3》背后:百度知识图谱前夜

这几天百度不断出新,让人目不暇接。在极简首页之后,《小时代3》的百度知识图谱也悄然在搜索页上线。《小时代3》大热之际,其错综复杂的人物关系并不是每个观众都能理...

3936
来自专栏机器之心

专栏 | 超越图灵测试:自省性问答才是检测真正人工智能的方法

机器之心专栏 作者:杭州北冥星眸科技有限公司 CEO 钱小一 1950 年,英国数学家阿兰•图灵(Alan Turing)提出了图灵测试(Turing Test...

3169
来自专栏AI研习社

如何让人类上瘾 浅谈聊天机器人抓住用户的艺术

在飞速发展的 AI 领域,聊天机器人极有可能是下一个风口。 在其核心,聊天机器人做的事情,是模拟与用户的双向通话。取决于不同的场景和目的,谈话内容有可能是天气,...

3286
来自专栏Java学习网

你真的需要了解多种编程语言吗?

你真的需要了解多种编程语言吗? 我在谋杀自己的职业生涯。没错,很多人都这样说我。 我的同事刚刚得知我即将离开公司的消息。大多数表示理解。但让他们困惑的是,我现在...

29510
来自专栏数据的力量

在腾讯2年,我学到了这15条关于运营的干货

19711
来自专栏EAWorld

在微服务世界度量DevOps,你准备好了吗?

1.无度量不DevOps DevOps的推广打破了开发,运维之间的壁垒。全员以产品交付为目标,提高效率,完成业务。久而久之消费者就会形成一个潜意识就是:买了这个...

2977
来自专栏理论坞

如果你是一名产品经理,这10条建议或许对你有帮助

知乎的热门问题“作为产品经理,过去的一年都有哪些进步、收获与成长?”本文整理了一份不错的回答,希望从事产品经理的你有所收获。

1032
来自专栏量子位

量子计算的里程碑:用超算模拟45个量子位(附论文)

陈桦 编译 量子位 报道 | 公众号 QbitAI ? 关于量子计算机性能超越传统计算机这一关键转折点,计算机科学家有个专有名词,即“量子霸权”。从各方面来看,...

3474

扫码关注云+社区

领取腾讯云代金券