云中生长——移动互联网时代的用云价值观

3月19日,首个海量2.0【云中生长】讲座在腾讯举行,本文为当天分享内容整理。

讲师:谢明(Reganxie),腾讯TEG架构平台部助理总经理,T4专家,通信与信息系统专业博士,在海量服务系统架构建设、管理方面拥有非常丰富的经验。同时也是腾讯海量服务之道2.0技术体系的核心骨干。

现在互联网发展浪潮已经转变为移动互联网,过去几年互联网行业发展越来越快,新的APP出现也越来越快。来自WWDC 2014大会的数据显示,iOS 注册开发者900W,50%增速/年速度增长;开发者数量,包括腾讯开放平台应用报上架的应用,开发数量都在快速发展阶段,这个速度超过了PC互联网时代。互联网行业正呈现出百舸争流、百花齐放、团队更小,产品的生命周期曲线更陡、时间窗更短、竞争更激烈的发展趋势。

面对这样的移动互联网市场环境,研发团队成功的关键在于快速的思想验证,迭代学习的速度是否比对手更快,要快速进化、适者生存!

优秀的团队 = 团队能力 * 迭代速度

思想迭代中,团队在验证中快速学习,团队对用户理解快速提升,适者生存,比竞争对手进化得更快。要借助“云”杠杆撬动研发力量,云中生长是快速思想验证,快速迭代学习的重要手段。

好的团队是动态的,迭代,成长来的,三五个人做不好的事情,往往30到50人做的更烂。这个过程中,好的产品无数次迭代过来,而不是一次完美的设计出来的。它是不停打磨,不停试错,不停验证中,和不停跟用户交流反馈中磨炼出来。

从动态运营观点来看,优秀的团队等于团队能力很强大,迭代速度也非常重要,思想迭代当中,团队要快速学习,团队对用户理解快速升,现在互联网残酷竞争中,能否生存下来,这决定于你是否比对手进化更快。如果你的一个特性需要一个月才能迭代一次,你的竞争对手只要一周,或者三天,大家可以想像这样的结果是什么样。上周我去了北京跟58交流,他们已经较大的基础设施规模,他们的基础设施方面遇到了非常多的问题,包括运维问题,网络问题,他很羡慕说,其实我们都知道腾讯的技术设施非常完善,他们非常希望用到腾讯的基础设施。即便像58这样的规模的公司都会遇到这样的问题,对于一些小的创业者来讲,他一样也会面临这样的一些困境。

嘀嘀打车救火案例

举个例子。2012年嘀嘀打车爆发, 2013年12月份,两家公司陆续进入补贴模式,后面过程大家比较清楚,你补5块,我10块,基本上是这种模式。一下子就把整个打车市场点燃了,这个过程也碰到很多问题,那个阶段基本上是用户早上起来用嘀嘀打车叫车,叫不到,什么原因,垮了,就跑到快的,也不行。

那段时间,一个垮了,一个又垮,当时我们也有技术架构部帮他做一些,故障的后果就是,大家看到网上很多新闻说,故障,最痛苦的是叫来了车,付不了钱。2月16号,呼叫量很低,我们去北京资源嘀嘀打车,2月23号的时候,后面实在不行,整个搬到腾讯云机房,2月28号的时候,涨了很多。

对我们公司业务来讲很简单,但是外部的创业者来说是挺难得的,可以说挺振奋的事情。我们到北京一看,他当时已经有不少服务器,要扩容,当时她们两个运维人员,平时做运维加变更,两个运维员要台机器,两个人跑到机房搬机器去了,那天就不能变更,到了机房以后,当天本来扩11台,结果只扩了一台。大家也可以看到,对于创业公司来讲,自己做这些基础设施的保障维护,对于业务发展实际上非常大的拖后腿的事情。

2月21号的时候,比较平滑,在此基本上每天掉一个坑,做完了优化,他的能力已经上去了。过了那个阶段以后,很多运营就很好了,当时的老板们在群里说,我们有很多补贴方法,除了现金,但是不能上,很着急。如果再早一点解决掉这些问题,或者再早一点架构师帮业务团队克服这个问题,我想在产品竞争和业务发展上面会好很多。

1

用云者也能成为技术引领者

对于云,一些有技术情节的开发人员认为这些云服务都不行,我的技术最好,我又有资源,又有人,从头建设自己的“云”,可控性更加高。

这个时候,你的团队急速膨胀,人员数量和能力赶不上业务发展,文化被稀释、平均战斗力下降,仅仅为了证明技术更好? 云中生长的观点:用云者也能成为技术引领者。

Netflix 是世界上最大的云计算用户之一,而Amazon自身的视频服务却是 Netflix 的有力对手。两个巨头在敌友关系间保持着微妙平衡:Netflix 打造了成熟的工具以使自己的软件可以在 Amazon 云上运转良好,Amazon 则模仿着 Netflix 的先进之处,并将成果作为服务提供给企业用户。比如奥巴马总统选举的所有大数据运算都是在 Amazon 上完成的,而这项运算的源代码却是出自 Netflix 工程师之手。

Netflix 几乎把 AWS 的功能发挥到了它的极致。“我们对 AWS 的利用比 Amazon 零售部门自己的人用得还要好,”Netflix 的云架构师 Adrian Cockcroft 说,“我们十分确信这一点。” Netflix 的技术不仅改变了自身处境,还影响着传统影视剧制作厂商。好莱坞工作室过去用光盘向 Netflix 提供拷贝,要 3.14PB 的空间才能存放 Netflix 所有片源。而现在,他们通过 Netflix 的 Backlot 系统来传输已加密的片源。

Netflix 接收后,将这些文件进行压缩并转换成 100 多种版本,每一种版本对应一种带宽、设备或是用户的语言环境。这些文件从 3.14PB 被压缩成了 2.75PB。

不一定去实际做,但是你在可控的应用过程中,你也能成为这个地方的领先者,作为Amazon云的使用者Netflix就是很好的一个例子,这个对于我们很多有技术情节的同学们来讲,是一个非常值得思考的。云中生长观点是说,应该正确认识工具的价值,合理柔性用云,帮助业务团队成功,让团队有成就感。业务确实需要而云短时未能提供的服务,可以自己快速实现;云中已满足的服务,要舍得转移,集中精力在业务上!

2

相信云之大势,但不过度依赖云

对于云,另外一些开发人员会倾向于全面依赖已有“云”基础设施。等待云提供所需的服务,埋头解决其他问题,如架构优化、Bug修复、故障处理,新特性、产品运营、统计分析,大量工具、监控、安全需求等。

这也不是最优的,让我们先看看世界最大云提供商Amazon的几个运营案例:

2011.4.21,运维误操作和EBS系统故障,US East Region的一个AZ中的13%的EBS卷和45%的Single-AZ RDS实例及2.5%Multi-AZ RDS实例,后续进而影响到整个Region的EBS管理操作。事故影响持续3天以上,并最终导致该AZ中0.07%的EBS卷和0.4%的Single-AZ RDS实例无法恢复。2012.6.29,供电故障影响US East Region约7%的EC2与EBS实例,电力恢复后EC2和EBS实例的恢复持续了几个小时……

2012.10.22,程序bug导致US East Region某AZ EBS re-mirroring风暴,该AZ大多数EBS卷不能服务,进而影响该AZ的RDS和ELB服务……

2012.12.24,运维误操作导致US East Region中6.8%的ELB实例无法正常工作近1天……

每次故障都有大量应用受到影响,但在其中一次故障中Twilio和NetFlix安然无恙,前者是因为根据亚马逊的技术规范进行了出色的设计,后者通过使用多个数据中心的服务来确保服务的可靠性。碰到这些问题的时候,有的应用受到影响很大,有的应用安然无恙,为什么?前者是做了云措施,后者通过数据中心的服务确保服务的可靠性,这是云中生长的关键。云中生长的观点:相信云之大势,但不过度依赖云,未来云一定会成为像现在的水电一样,都离不开的基础设施,这个过程中,我们可以做很多事情,使得我们的业务更加可控。

在移动互联网时代,后台架构师也要与时俱进,好的架构师要会用云。架构师要摆脱做云的情节,具备用云的胸怀,借助云的技术杠杆帮助团队争取时间窗,竞争中加快步伐,赢得竞争胜利,体现技术人员的价值。这不仅是一种能力,更是一种责任!因为对于我们每个技术人员来讲,我们最大的成长是什么,技术的成长固然很重要,我们在技术上面不断做得更广,更细,更精,更深,但是最重要的是我们在技术成长过程中,也能够帮助业务发展,我们能够运用自己的专业技术和专业能力充分的利用各种基础设施和基础服务,来加速我们业务的发展,满足业务在成长过程中所碰到的,解决成长过程中碰到的各种困难和问题。这才是一个好的架构师的能力,也是好的架构师的价值,更是他的责任。

关于海量服务之道2.0

2015年,腾讯正式推出海量服务之道2.0,PC时代,海量服务之道1.0支撑腾讯经历了用户规模从0到1,从1到亿并向10亿迈进的快速增长过程。在用户全面往手机转移的今天,一套适应全新移动云时代技术体系——海量服务之道2.0正式面世。海量服务之道2.0由3大价值观,7大方法论组成。集合了腾讯多年来在互联网技术上的经验和反思,众多崭新的观点,将对推动行业的技术潮流发展有非常正面的作用。

原文发布于微信公众号 - 腾讯大讲堂(TX_DJT)

原文发表时间:2015-03-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人称T客

SalesForce白皮书:SaaS 初创公司成功的 7 个秘密

T客汇官网:tikehui.com 编译|徐婧欣 ? SalesForce的这篇白皮书分析了SaaS创业公司的挑战,并为各种业务领域提供了相关指导。一些来自于...

28350
来自专栏哲学驱动设计

用户反馈:对 Rafy 开发框架的一些个人建议

这篇文章是去年 Rafy 框架发布后,许胜平先生为我提出的一些建议。他从用户群体分析、社区、商业模式、技术支持等方面对框架发展提出了建议,我觉得写得非常不错。...

20080
来自专栏数据猿

IBM技术总监房树新:IBM在电信领域大数据应用和实践探索

<数据猿导读> IBM技术总监房树新在2016年中国信息通信大数据大会上发表了以“IBM在电信领域大数据应用和实践探索”为主题的演讲 ? 数据猿报道,2016年...

32560
来自专栏BestSDK

游密全球首发H5游戏通讯云,接入SDK兼容所有浏览器

经过三个月的开发、测试,游密科技宣布,全球首个H5游戏语音通讯解决方案正式上线!继解决了手游的社交通讯需求后,游密再一次为H5游戏开发团队开辟了一条新的语音通讯...

40140
来自专栏数据的力量

【用户运营】我看过的最好的关于用户运营文章:用户运营的定义、演变和方法论

67150
来自专栏云计算D1net

变革时代 国内通讯云服务厂商对比介绍

这是一个云计算的时代。 这是一个互联网的时代。 这是一个分工合作,快速奔跑的时代。 云计算的概念在国内经过多年的造势与推广已经逐渐的落地,随着IaaS、SaaS...

67050
来自专栏华章科技

大数据分析然并卵?那是因为你没做到这些

看到这篇文章,感觉对数据分析一些点总结蛮好的,分享给大家。数据分析要产生真正的价值,或者说要让业务方,管理层感觉到真正的价值,其实需要非常多的东西:

4710
来自专栏WeTest质量开放平台团队的专栏

三年同行,质造未来,腾讯WeTest五大服务免费体验

? WeTest 导读 2018年10月26日,腾讯WeTest将正式迎来三周岁生日。三周年庆典期间,只要在WeTest平台注册的用户,均可免费体验标准兼容、...

14120
来自专栏韩伟的专栏

需求变化的根源是什么?

在不按时算薪的行业里,软件开发应该是加班最多的一个行业。码农,是很多程序员用以自嘲的称谓。长时间的加班,大量的BUG,无穷无尽的特性,永远都在做的重构,伴随着程...

36130
来自专栏智能算法

技术人,为什么需要构建知识图谱?

作者简介:安晓辉,10多年开发经验,曾任软件开发工程师、项目经理、研发经理、技术总监等岗位,著有《Qt Quick核心编程》、《Qt on Android核心编...

556140

扫码关注云+社区

领取腾讯云代金券