前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >运维专题第3期:诊断专家

运维专题第3期:诊断专家

作者头像
腾讯专有云
发布2022-06-24 17:39:33
8040
发布2022-06-24 17:39:33
举报
文章被收录于专栏:腾讯专有云腾讯专有云

在上一期《运维专题第2期:警戒哨兵》中,我们介绍的是运维平台中的监控系统——云哨,今天给大家带来的产品是巡检平台,在运维过程中能够跟监控系统一起为客户带来稳定的保障。

背景介绍

在笔者从业云服务的多年经历中,遇到很多客户在交叉使用监控和巡检两个运维服务时会有不清晰的地方,同时因为部分功能相似,引起交付时客户的疑问。

今天我们就来聊一聊监控平台和巡检平台的使用场景和差异,同时,也邀请你来观摩一下我们的运维产品优势,希望助你使用时“双剑合璧”。

相同之处

在运维领域中,我们一般会把运维故障管理拆分为三个阶段,从流程上分为发现故障、分析故障和解决故障;在设计时监控和巡检都包含发现故障、分析故障的能力。

这时候很多客户就会困扰了,这两个工具好像定位一样?那能不能给它们分下工各司其职呢?

当然可以,请你看看我们是怎么设计区分的!

不同之处

角色不同

举个例子,我们会把监控平台类比医院里的检测仪器或者体检项,比如血压仪、心脏监护仪器等,它能丝毫不差的记录一段时间的指标数据,并且在达到阈值时可能会有一定报警通知能力。当报警指标多了,一般人就难以综合分析了;这个时候就该用巡检平台来实现了,我们会把巡检平台类比医院的专家号,通过专家分析病人的各种指标数据,给出综合分析和医疗方案,这种能力需要积累多年行业经验和或者综合多项指标才能给出,所以,这两个平台是相辅相成的关系。

执行频率不同

监控平台中的监控项是秒级或者分钟级别执行的,可以认为是近实时的执行;而巡检平台的执行是小时级或者天级别的,因为综合分析对于低频就够用了。

输出不同

监控基本能力是过程数据记录+报警,输出的是指标明细+告警;巡检能力是综合分析+巡检结果,输出的是巡检报告,巡检报告包含了问题资源列表和各种修复建议等专家知识库内容。

上报方式不同

监控平台的结果一般用 Agent 方式来实现近实时上报监控结果,而巡检平台适合做综合分析,依赖调取多出明细分析,经常使用 API 调用方式来获取过程数据和上报数据。

使用场景不同

上面这些差异就决定了这两个服务的使用场景差异,监控平台相对高实时执行的能力决定了它适合高SLA场景的故障发现。假如你的故障需要分钟级或者秒级通知运维人员,就需要作为监控项放在监控平台;而巡检平台适合相对低频执行和专家经验,决定了巡检平台更适合低SLA要求场景,比如容量规划问题、产品健康度分析、安全隐患分析、全局架构优化等非常适合巡检平台来实现。

这样的产品哪里有

来腾讯专有云,给你不一样的运维服务体验。

监控平台云哨已经在前几期介绍过,下面重点介绍我们的巡检平台:

我们的巡检平台,除了上述不一样的设计体验,在扎根产业互联网过程中,与多家客户交流和交付中吸取客户痛点后,我们还为用户量身定做多项差异化竞争特性。

差异化特性一:灵活的编排能力

巡检平台可以根据用户部门分工,可灵活组合不同人员需要的不同巡检项,编排为不同的巡检报告在不同的时间发送给不同人员,足够的灵活。

差异化特性二:丰富的巡检原子能力

我们除了内置开箱即用的巡检项,我们还为用户提供丰富的巡检能力,包括基于脚本的巡检(支持 Python 和 Shell 多种语言)、HTTP 巡检、IP 巡检等,其中脚本巡检可以支持在线编辑脚本、上传脚本包、上传包含多脚本的容器镜像,对于有一定开发能力的用户,可以快速增加巡检项。

差异化特性三:自定义巡检项能力

我们的内置巡检项和自定义巡检可以开放给用户自定义巡检阈值等,以及用户可以把其他巡检项克隆为自己名下自由修改。

差异化特性四:海量巡检项

目前巡检平台最新版本内置400+项,未来将增加到1000+,其中包含了大量运维专家和产品专家的优化建议,海量的知识库还在积累中,敬请期待新版本!

什么是好的运维产品?

笔者认为,首先是易用性,运维产品化也应该遵循产品设计的体验好和易用的要求,运维产品能做到开箱即用就是基本要求;

其次,是自定义能力,因为运维产品是面向运维人员,在 DevOps 潮流的今天,很多运维人员都有一定开发能力,那自定义开发的能力也可以是好的运维产品的能力,从而做到运维产品特性的快速扩展;

最后,是智能化,能够针对初级运维人员提供快速解决运维问题的能力,比如自动分析故障、有针对性提供知识库,让运维工作做到高效,提高产品SLA,这是运维工作的关键目标。

感谢本期主题作者闵桂龙给我们带来的精彩介绍!下期主题日志平台,感兴趣的朋友们可以点一下关注,咱们下期见!

-【END】-

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-07-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯专有云 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
金融专有云开发测试平台
金融专有云开发测试平台(Financial Private Cloud Research and Design Test Platform,FPCRDTP)为用户提供一套由腾讯云运行维护的小型化专有云环境,方便用户进行开发和测试,降低维护成本,提升效率。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档