首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

稳定性问题不解决,CIO注定是背锅侠

从企业信息化到数字化转型再到产业互联网,名词的不断变化意味着IT在企业地位的不断提升。

于是系统越上越多,每个系统版本还在不断升级和迭代,各个系统错综复杂的连接在一起,像一张巨大的蜘蛛网,任何一个节点的故障都可能带来蝴蝶效应的后果

特别是ToC的企业,前端业务变化极快,带来流量突增、上下游连接故障等问题,让IT人长期扣着背锅侠的帽子。

带着这样的疑问,来自前阿里、百胜、申通、捷豹路虎、上汽通用、邮乐网、KPMG等公司的IT高管们济济一堂,共同探讨解决之道。

本次茶话会我们有幸请到了经历过4次双11的童总,是系统稳定性领域的专家,也完整的经历了阿里双11从“光明顶72小时会战”到“喝着咖啡过双11”再到“丝般顺滑”的全过程。

在本期茶话会上,童总为大家总结出从监控到问题排查再到性能优化的完整的保障系统稳定性的经验。

童庭坚PerfMa创始人

前支付宝性能测试专家(花名子喻)

先后任职于惠普、支付宝等互联网巨头公司,专注于性能测试领域深耕7年,致力于性能压测、性能优化分析等系统稳定性保障方面工作,曾代表蚂蚁金服性能测试团队多次参加TOP100、APMCON等国内大型性能管理大会。在支付宝任职期间主要负责测试工具平台主力研发及双十一、双十二等大促活动的性能容量保障,为双十一破百亿背后的数据保驾护航,并获得双十一老A(每年全阿里仅11个)。是性能测试极客圈的大咖网红。

今年的双11马上要到了,当各路诸侯还在纷纷采购服务器的时候,阿里已经开始双11的生产环境预演了。

利用CDN搭建真实环境模拟极端情况,引入全链路压测,用非侵入式的方式监控全过程。

在如此庞大的分布式环境中做到2分钟之内发现并定位问题,甚至完成定责(程序员小哥哥的绩效啊!!)

通过反编译查看代码,提高协同效率,从而快速正确的完成决策,及时处理问题,保障系统稳定性。

原来每年的双11还能受到马老师的慰问,现在看不到咯!

每一家公司由于业务特点和系统现状,相应的稳定性策略有所差别,ToC的要求快速相应,业务部门甚至上午发现业绩不行,下午就要求上大规模的活动。

这就和消防队一样了,平日的高强度、高真实度的演练就变得极为重要,否则类似百胜这样的企业,系统瘫痪几分钟就是数十万的损失。

ToB的企业由于业务链条环环相扣,对稳定性要求更高,IT策略往往会因为稳定性的要求放弃一些灵活性,尽管时效要求没那么高,但对出现问题的及时解决能力要求并不低。

IT在现代企业中越来越重要,不仅仅是技术背景的当CEO越来越多了,IT技能也是各个CXO的必备,而稳定性就是悬在IT人头上的达摩克利斯之剑。

接下来的数年,稳定性这个词被提及的频次将越来越高,也意味着IT从功能大跃进时代开始迈向常态化运营时代,IT人不应再等同于加班、救火、背锅了。

我们就喝着咖啡,静静的看着前端的业务们厮杀就好了!

-the end-

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190827A0NPRJ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券