IT是服务也是担当

CIO的角色已经从“交付型”向IT和业务相结合的方向转变

Gartner之前的报告里曾经有这样一个结论,即CIO的状态是“交易型的CIO”(只能从事传统IT工作),还是“业务合作伙伴CIO”(能够胜任数字化工作),以及“处在风险中的CIO”。无疑,处在风险中的CIO将面临巨大的压力。通常情况下,考核CIO的业绩指标可能是有没有成功实施一个SAP项目,或者是网络的可用性等等内容。但是,如今考核的是CIO是不是在帮助企业增长销售收入,帮助企业实现多少增长利润,是否影响到了企业的商业模式,能否帮助企业设定预算(包括IT预算及业务预算)、有没有使企业的业务更加敏捷……

越来越多的CIO或者CTO被任命为企业的副总裁,原因只有一个:IT即业务,没有IT的保障,也就不会有业务的持续增长,所以包括CTO在内的所有高管懂业务是对其最基本的要求,在此之上才是懂得技术战略和技术管理。

改变

每一天,我们都在经历着改变。从中国古代的四大发明到今天让我们更加引以为傲的新四大发明,新的四大发明已经成了我们日常生活中不可缺少的必须存在。大家还记得您有多久没有带钱包出门了?

科技的发展,给世界带来了翻天覆地的改变。但是新四大发明里面有一个共同的特点,那就是以网络为前提。如果没有了网络,新四大发明就只变成了一个名词。

上图就是改变带来的结果,但是科技无论怎样发展,世界怎样变化,都离不开一个健康的网络,可以形象的把我们生活的地球想象被一张强大的网络覆盖着,所以网络的好坏快慢,直接影响着我们的生活质量。

人类健康 —— 关系着人类的生命

每一年,全球有1.9%的新生儿死亡率,99%以上是死于病痛。我们从还是小蝌蚪的时候就跟着妈妈去做孕检,产检,然后到现在的体检。

引用一句网红用语:“为什么我们从小到大要做这么多的检查?全都因为健康很重要!”疾病晚期需要手术和早期发现可以预防的区别其实就是生命是否存在的因果。

网络健康 —— 网络保障是业务生死存亡的关键

一个数据中心的运行质量和网络的好坏更加息息相关,网络承载了数据中心所有的业务,双十一的交易量是以秒极计算的,试想活动刚一开始,数据中心断网了,哪怕是一分钟,谁能估算出会给我们的交易额带来多大的影响?

背锅--网络本身问题不到10%

看到这篇文章的你,是不是也跟图片中的背锅侠一样,有着英俊的外表,却摆脱不了背锅的无奈。我们日常帮客户排查问题的时候发现,80%以上的系统出现问题第一时间查网络,95%以上的前端业务出现问题第一时间找网络,100%的黑客攻击安全问题也来自于网络。

但是最后真正定位并且确认是网络本身问题的却不到10%,原因是因为网络是一个重要的载体,所以出了问题我们难免背锅,而网络流量其实记录着每一次从客户端访问到后端的整个流程,我们完全可以基于对网络流量的分析来摆脱现在的困境。

nCompass智能流量大数据分析平台能够有效化解上述现状问题。

通过数据流分析定位故障域

无论您是什么行业的客户,我相信都会关注这三点:

第一,前端:用户访问我的用户体验和效果如何?

第二,自身:网络及应用端到端的各个节点的运行状况的好坏快慢?

第三,后端:我依赖的后端服务及响应如何?

如果有这样一张图:

纵向,它能清楚的划分您业务前端到后端每一个区域的总体状态。

横向,它能把每一个区域下的应用/网络/TCP会话及主机的情况以实时的真实数据直接呈现在您的面前。

如果再配上智能学习基线帮您把每一条预警及告警制定好规则,这样不但会减轻我们日常运维的压力,更加缩短了故障定位的时间。学习基线的配置,更是把事后定位故障,提前到了对事前隐患的排查和优化,有效的避免了重大事故的发生。

最后,再给您出一份每周或者每月的系统综合评分报告。问题/隐患/用户体验/后台响应,一目了然。

数据运维智能化演进过程

运维的演进过程,需要的不是有病看病,更不是出了事故才能用得上的单一产品。

完整的解决方案和更加智能的运维平台才是客户真正需要的。从最初的只能实现一些日常监控和基础运维工具,到所有数据实现归档检索;从能够做关联分析到实现预测和机器学习。

大数据平台,智能算法,场景知识库

传统运维工具的架构已经远远满足不了高速发展的业务系统及复杂环境的故障定位,数据回溯再准确,也避免不了重大事故的发生及造成的损失。

nCompass强大的计算平台和机器学习的算法规则,能够支撑起快速发展的业务和越来越复杂的IT环境。如何能够实时优化系统中的隐患,排查未知故障的能力才是所有用户最关注的。各行各业都存在竞争,解决方案厂商和客户都要面临这个问题。我们现在和未来拼的一定是系统的健康度,而不是故障出现之后定位问题的准确度。

无论是人类还是IT系统,我们都希望不得病或者减少故障的发生,没人愿意承受得了病治疗时候的折磨和出了事故排查问题的压力和过程。

强大的计算平台和算力是nCompass目前最领先的技术优势及品牌影响力,颠覆了传统产品的架构也是我们不可被替代和超越的关键。

机器学习基线

阈值设置的告警不能够完全代表真实的故障触发,基于智能的机器学习基线能够提供多维度的基于真实环境的标准及实时隐患排查。

每一个客户都有自己的IT系统。曾经很多客户遇到过同样的问题,如何衡量自己系统运行质量或者速度的好坏快慢,有没有行业标准来定义我的系统处在什么范围内是好的,什么范围内是慢的。但是大家要知道,就算是同行业的客户,不同客户,不同体系,不同规模,不可能拿别人的标准来衡量自己的系统,nCompass产品通过机器自动学习的模式,充分让用户了解自己的IT环境,用准确的数据告诉您,您的系统在什么时间内什么范围值内是标准的,什么时间内是不正常的,好坏快慢是否有隐患,都会通过学习基线来实时分析。一次超出基线的动作,就有可能是一次隐患或者一次事故。

智能分析引擎

传统的运维工具叫网络回溯(NPM),问题出来之后5分钟告警,然后下包,人工进行分析。这个定位问题的过程最快的经验丰富的专家也要至少30分钟。市场上也有提出秒级的概念,也就是说发现问题,以秒为颗粒度告警,但是依然解决不了下包,需要凭借有经验的专家进行人工分析。

nCompass是秒级发出告警,利用自主研发的智能分析引擎来在线分析和定位问题,这样即避免了人工分析带来的误判,又节约了大量的时间成本,一次重大的事故,它的时间成本是按秒计算的,60秒钟可能给客户带来的就是成百上千万的经济损失。我们要强调的不是我们的秒级告警,而是我们的智能分析引擎能够快速定位问题给大家节省的时间成本。

上图是nCompass产品平台根据不同维度,不同部门的需求,帮客户制定的不同维度的大屏展示。

用户可以根据自己的需求,把自己关注的业务或者系统直接放到大屏上做展示,这样能更加直观的了解自己系统以及业务的关联情况。

联盟/ 健康 / 生态

强大的联盟能力也是nCompass平台的优势之一:

支持多种的数据采集模式,包括网络流量/日志/netflow/三方系统数据,还包括zabbix/nginx等众多的开源软件和客户自研系统的对接。

我们不但是一家能够为您提供解决方案和大数据分析平台的厂商,我们更愿意和您成为合作伙伴,与不同的团队互相学习,吸取更多客户的意见及建议,与您一起成长,一起见证我们共同的进步和改变。

nCompass 数据流分析的价值综述

IT既是服务也是担当,IT人不易,IT运维更不易,一次小的隐患或者操作就真的有可能造成一次重大的事故,不是玩笑,也不应该当成笑话。心怀敬畏,做好多种解决方案才能保障万无一失。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180628G1H4SL00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

同媒体快讯

扫码关注云+社区

领取腾讯云代金券