专栏首页廖念波的专栏谈谈后台服务的灰度发布与监控
原创

谈谈后台服务的灰度发布与监控

为什么要有灰度发布与监控

《海量服务之道》里的《灰度发布》和《全方位监控》这两门课想必技术同事都已经学习过了。我觉得这两个方法论是非常具有行业特色的,也是非常具有腾讯特色的。

笔者在加入腾讯QQ后台团队之前,曾经在电信行业、金融行业做过几年开发工作。刚进入腾讯时,觉得技术上很多地方让人耳目一新:

  1. 后台系统都是部署在非常多的廉价服务器上,每个人都会管理非常多的机器,让人觉得很有成就感很富有
  2. 有比较精确的设备预算计算模型,每个服务器的性能在考虑容灾冗余的前提下,通常被压榨到刚刚好,负责人会深入的洞悉整个系统的性能、容灾、柔性等方方面面。能负责一个海量的系统是很荣耀的一件事情
  3. 没有专职的测试人员,经过开发者自测后,灰度发布加详细的监控,主要的系统几乎每两周都会被发布一轮,作为后台技术人员,自己的工作直接影响数以亿计的用户,有点手握核弹处于上帝视角的感觉
  4. 监控系统(我们内部一个叫monitor的系统)真的是太方便了,一条条曲线直观的展示整个系统运作的各种指标,如果有异常短信和电话就会响起来,让人觉得一切尽在掌控,有一种面对着大量仪表盘操控着航母游弋或者是战斗机挂着核弹翱翔的感觉。

好了,赶紧结束程序员意淫的美好感觉,我想说的重点是:灰度发布和监控真的是互联网海量服务必备的两大利器,能够极大的提高后台服务可用性和运营水平。

当然,灰度发布不只是一部分一部分的发布新代码,监控也不只是绘制曲线和告警短信那么简单,这里面深究下去会有很多东西,背后的哲学是持续交付、用户测试和尽在掌控。

毫秒服务引擎(msec, 取英文名Mass Service Engine in Cluster的首字母组合)是腾讯一个开源框架,其创作冲动和构建经验,来自QQ后台团队超过10年的运营思考。灰度发布能监控是毫秒服务引擎设计的重要考量点。

毫秒引擎里是怎么做的?

灰度发布

在服务配置管理页点击“制定发布计划”

选择这一次灰度要发布的目标机器和发布类型:

在接下来的向导中选择正确版本的配置文件、外部库、业务插件等,这样就完成了发布计划的制作:

接着,点击菜单 “运维->发布”,可以查询所有发布计划,对于已经发布的计划,可以做回滚操作。点击详情可以查看发布计划更详细信息,并执行发布:

监控

关于监控,在第二篇:RPC和路由管理那里讲得已经比较详细了,这里不赘述,只说明一下:除了RPC和框架本身自动上报的一些信息,还支持业务自定义上报信息(例如我想上报第28级VIP用户登录的次数),且支持对于关键指标的波动、最大值、最小值设置告警:

结语

灰度发布和监控是互联网海量服务必备的两大利器,能够极大的提高后台服务可用性和运营水平,背后的哲学是持续交付、用户测试和尽在掌控。借助毫秒服务引擎,初创团队可以快速获得这两大利器。详细的可见腾讯云服务市场毫秒服务引擎官网,或者微信公众号:msec-engine

相关推荐

后台服务标准化运营

谈谈后台服务的RPC和路由管理

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Spider 引擎分布式数据库解决方案(最全的 spider 教程)

    最近开始负责财付通的数据库的相关维护工作,其中有几套系统使用的 spider 引擎,本文将 spider 引擎的功能、使用场景、部署、实战测试等做个简单的总结。

    飞鸿无痕
  • Amazon Aurora:云时代的数据库 ( 中)

    文章详尽的介绍了 Aurora 设计背后的驱动和思考,以及如何在云上实现一个同时满足高并发、高吞吐量、高稳定性、高可用、高扩展的云数据库。

    谭伟华)
  • Scrapyd 日志输出定时清理

    现在维护着一个新浪微博爬虫,爬取量已经5亿+,使用了Scrapyd部署分布式。Scrapyd运行时会输出日志到本地,导致日志文件会越来越大,几十个G,这个其实就...

    崔庆才
  • 【腾讯云的1001种玩法】构建企业级应用环境之数据层面优化(一)

    本系列为两年前 VMCloud 云平台的进阶篇,本次借助 QCloud 的《1001种玩法》活动来继续完成进阶篇,主要以在 QCloud 上搭建一个完整的应用环...

    李斯达
  • 分区表场景下的 SQL 优化

    有个表做了分区,每天一个分区。该表上有个查询,经常只查询表中某一天数据,但每次都几乎要扫描整个分区的所有数据,有什么办法进行优化吗?

    叶金荣
  • 腾讯云采购节服务器三折起,这才是人民的云计算!

    4月24日,腾讯云正式启动 “腾讯云采购节”大促活动,活动期间旗下云服务器、云数据库、域名等多款核心产品大幅降价,最低折扣达3折,优惠方式也涵盖了新用户礼包、大...

    云资讯小编
  • 基于 MySQL 5.7多源复制及 Keepalived 搭建三节点高可用架构

    MySQL 5.7发布后,在复制方面有了很大的改进和提升。比如开始支持多源复制以及真正的支持多线程复制。本文讲述基于 MySQL 5.7多源复制及 Keepal...

    叶金荣
  • 公有云的商业模式分析

    最近看到一篇文章,里面以酒店为比喻,对公有云的商业模式进行了分析,还比较生动、形象。在社区里摘录如下。

    EarlGrey
  • 腾讯云分布式数据库(DCDB)

    DCDB 是部署在腾讯云公有云上的一种兼容MySQL协议和语法,支持自动水平拆分的share nothing架构的分布式数据库。分布式数据库即业务获取是完整的逻...

    苏强
  • Amazon Aurora:云时代的数据库 ( 上)

    文章是 Amazon 在 SIGMOD\'17 上最新发表的关于 Aurora 论文的翻译版本,详尽的介绍了Aurora 设计背后的驱动和思考,以及如何在云上实...

    谭伟华)

扫码关注云+社区

领取腾讯云代金券