前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >阿里、字节两位技术大咖解析可观测服务上层业务的本质|QCon

阿里、字节两位技术大咖解析可观测服务上层业务的本质|QCon

作者头像
深度学习与Python
发布2023-03-29 13:38:17
5010
发布2023-03-29 13:38:17
举报
文章被收录于专栏:深度学习与python

随着越来越多的应用采用云原生架构,大家对可观测性的关注度和讨论度也越来越高,那么可观测性到底如何服务好上层业务?

本周,InfoQ 大会早班车栏目策划的“可观测在企业的实践应用与实际价值”直播中也谈到了这个问题,直播嘉宾阿里云资深技术专家周小帆(承嗣)和字节跳动可观测性平台负责人孔罗星对此分享了各自的看法。

孔罗星:回答这个问题前,我们首先要思考,我们做可观测性是为了什么?肯定是为了服务好我们上层业务的目标用户,让他们的体验不受影响,这背后就需要保障后端一系列服务的稳定性,比如客户端的稳定性。

如果要保障这些稳定性,就要能及时地发现问题、解决问题,这些能力就很依赖可观测性的一系列技术。比如对我们来说,我们的业务包括抖音的 Feed 流、推荐,字节的电商等,他们背后的开发、QA、运维团队都是我们的业务方,所以我觉得这个问题大致可以说我们怎么服务好这些业务方。

以往大家可能不是那么重视业务监控,但现在我认为业务监控对字节这种规模的企业来说是最重要的。比如交易这种下单付款的业务流程,它需要有一些黄金指标去判断它有没有异常,或者说它现在出问题了,问题有多严重。大家都能体会到这些背后的重要性,但真正做起来却比较困难,因为不同的角色,大家对这些的认知可能不太一样。这时候,我们就需要跟这些业务团队一起去理清这些概念,然后把这些业务的监控点给他梳理完整。一旦业务监控完整了,不管业务方是做技术的还是非技术的,都能体会到业务监控的价值。这样他们也就产生了对可观测性的认可。

周小帆(承嗣):一个庞大的 IT 公司体系中有很多角色,服务好业务,其实就是服务好这个庞大公司里面不同的工种,通过不同的方式去服务好他们。

我们以“鹰眼”为例,它最开始服务的对象是谁呢?是研发人员,具体来讲就是我们这个微服务体系当中的研发人员。“鹰眼”的分布式链路追踪体系是通过一些上下游的串联,包括整个请求的全链路轨迹的回放等这些特性去服务研发人员,让他们在日常工作中能够很精准地排查到跨应用、跨进程中一些问题的根因。

但随着应用的发展,我们也逐步开始服务一些其他团队。比如对运维团队,可观测性的作用非常直接就是监控。但其实如今的运维承担了多重职责,它不光要保障基础软件包括基础设施的稳定性,它还要去看成本,包括在相对小型的公司中,它还承担了一些安全防护方面的工作,比如平时的攻击等这些安全方面的隐患它都要一肩挑起。那可观测性的产品以及数据,怎么样去服务好这些客户?其实是通过安全方面的一些特性(Cloud SIEM 和 RASP),包括像成本方面的一些报表等东西,帮助运维人员去更好地梳理平时的水位。我们说的容量预测也是同样道理,就是怎么样用最经济的方式去度过一个个业务高峰。

同时,我们还看到一些可观测数据也服务了运营人员,他们更关注客户的一些增长情况。当一个企业完完全全数字化以后,你的可观测数据很多时候能够反映你的业务运行状况。所以我们看到很多运营人员,他在观察这个业务增长的时候,他会拿这部分数据,通过一些清洗、梳理、编排来分析用户的一些使用轨迹、用户增长的一些分布情况等。可观测可以通过各种方式去服务这些不同的工种。

今天我们还看到一个情况,就是我们有很多不同角色之间的,所谓“融合工种”之间的协同。因为不同工种在沟通交流的过程中,他们很多时候需要拿可观测的数据作为沟通的桥梁。比如我们经常会看到运维人员拿着一些数据到研发人员那里说哪里不行,哪里需要修改,这些都是日常工作中常常见到的案例。

所以说,可观测并不是直接地给上层业务带来什么样的收益,而是通过赋能一个企业的不同工种的日常工作,以及工种和工种之间的协同关系来去整体支撑一个大型企业的正常运作。这是我对可观测怎么样去服务好上层业务的一个理解。

为了让大家更了解可观测性在业务中的应用,将于 10 月 31 日 -11 月 1 日举办的 QCon 全球软件开发大会(北京站)上,我们设置了「云原生时代的可观测最佳实践」专题,邀请到阿里云资深技术专家周小帆(承嗣)担任出品人。目前已确定来自腾讯云、百度、云杉网络、阿里的 4 个议题,为你介绍典型行业在云原生场景下对可观测技术的落地案例与最佳实践。

此外,我们还设置了云原生微服务架构新趋势、云原生架构变革、研发效能提升、业务架构、面向资效平衡的架构设计、ML 模型效率与易用性等共 23 个专题,目前会议日程已上线,点击底部【阅读原文】了解更多专题详情。

团队购票可享更多优惠,购票请咨询:15600537884(微信同电话)。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-09-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 InfoQ 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
应用性能监控
应用性能监控(Application Performance Management,APM)是一款应用性能管理平台,基于实时多语言应用探针全量采集技术,为您提供分布式性能分析和故障自检能力。APM 协助您在复杂的业务系统里快速定位性能问题,降低 MTTR(平均故障恢复时间),实时了解并追踪应用性能,提升用户体验。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档