亚马逊Web服务超级用户论战DBaaS

高级亚马逊Web服务用户更喜欢自我管理运行在亚马逊弹性计算云上的数据库,而不是数据库即服务产品,至少现在看是这样的。

上周,AWS超级用户在线活动群组创立会议的演示中,关注超级用户如何在AWS上运行数据库。大多数演讲者表示他们在弹性计算云(EC2)上运行类似Cassandra和MySQL这样的自我管理数据库,而不是使用亚马逊的数据库即服务(DBaaS)平台,比如关系型数据库服务(RDS)以及DynamoDB。

然而,一些IT专家在此次活动中也表示有过DBaaS体验,而且一些仍旧在自我管理和DBaaS选择中保持中立态度。

美国加州一家提供在线社交学习平台的公司Edmodo,在将其MySQL操作从EC2上自我管理实例转移到RDS时,收获颇多。该公司的运营总监Jack Murgia表示:“在我们决定从RDS退出时,我们学到了更多。”

2011年春天,Edmodo为两百万用户服务,而且得到了风投公司的重大投资,他们将这笔资金用来雇佣Murgia,从而同拥有十个开发者的团队共同工作。Murgia介绍:“基本上我走过一扇门,就有一个数据库,一个熟练员工和一个苦工。”这些都运行在EC2上。Murgia进来后,人员配置上并没有一个数据库管理员。

跟着亚马逊RDS一路走来,其提供了一次使用MySQL管理繁忙的初创企业的机会。2011年秋天,该公司完成了到RDS的迁移。Murgia谈到RDS时说:“我们能够通过点击一些按钮,创建开发和质量保证环境,随着那年秋天负载的不断增加,用鼠标点几下就可以读取副本,改变域名系统记录。”

但是在多有效区域故障恢复的时候,RDS部署遇到了障碍。

“我们发现多AZ故障恢复在绝大部分时间都是失败的,”Murgia说,“有时候即便是计划中的故障恢复我们发现复制都是失败的,而且那个时候唯一的选择就是提出新的副本。”

主数据库有八个副本,每一个新的副本用时大约一小时,这也意味着Edmodo再一次服务于用户之前,要有一整天的宕机时间。因此公司重组了,准备转到RDS上一个单独的熟练员工,如果有什么失败了就要计划新的副本。RDS在2013年六月开始提供服务水平协议(SLA),这也让Edmodo寻求一种继续使用服务的方式。

但是随着Edmodo不断发展,该公司从外包公司引入了DBA,在2011年到2013年雇佣了更多的系统管理员。那时候,该公司拥有了内部运行EC2上自服务数据库的技能,逐渐离开RDS,转向自服务MySQL环境。

Murgia说:“我们的双手被RDS“黑盒”绑架。”如果Edmodo管理自己的MySQL和副本,IT团队可以促进副本到一个精通的员工,将所有的副本指向这个精通的员工并且重新启动并运行。相反,该公司致力于恢复数据库时,没有基础设施的控制就会出现失败。

“这是一种不得不做的妥协,”Murgia说道,“可能你不具备技能,可能你只是一个小的初创公司,但是随着你开始获得这些技能,并且开始提升性能和可用性标准,这就会成为问题。”

超级用户活动会议上的另一个演讲来自Stackdriver的IT专家,这是一家位于美国波士顿的公司,提供AWS监控即服务。这家公司通过Cassandra集群迎来了一个转折点,而且考虑了两种替代方案:扩展现有的集群或者部署亚马逊DynamoDB DBaaS。

“我们有非常繁重的工作负载,涉及数以亿计的数据点,而且Cassandra对于各种写操作过多的工作负载有很好的支持,”Joey Imbasciano说道,他是Stackdriver的云平台工程师,“Cassandra中的建模时间系列数据设计模式也是众所周知的,因此我们知道我们不会有任何问题。”

Cassandra另一个吸引人的特性就是能够以编程的方式删除数据,这样就可以让数据库保持一种可管理的规模,而且无需人工介入。Stackdriver也考虑了MySQL和RDS,但是感觉NoSQL更适合自身的数据集。该公司也在部署Cassandra的18个月前就关注DynamoDB。

“那时候,厂商锁定是我们尽力去避免的,”Imbasciano说道,“此外,我们做了一点成本估算,并且发现那时候使用Dynamo的成本要稍高一点。”

Stackdriver开始是三节点的Cassandra闭环,现在已经增长为36节点,随着其继续增长,该公司会再一次关注DynamoDB。“优势很明显,”Patrick Eaton说道,他是Stackdriver的架构师,“焦点就是自动化。升级是自动化的。亚马逊的全天候支持人员处理浙西额事情,他们可以在你需要时进行扩展。” Eaton补充:“此外,我们看到AWS一直在削减价格,因此从常量的角度来看,我们的价格实际上会随着时间的推移而变得更加便宜。”然而,该公司的Dynamo部署时间序列数据第一次部署还是要比继续使用Cassandra更贵。

“成本模型相当复杂,基于这些抽象的工作量,他们称之为‘写单元’和‘读单元’,这是一种请求率和数据规模以及一致性模型的结合,”Eaton说,“原型阶段很难评估这种模型的持续成本。”根据Stackdriver的计算,Cassandra持续管理价格为每月大约3000美元。主要集群成本为每月12500美元。在目前的Cassandra部署中,更小的集群预警成本大约为1300美元。

使用Dynamo作为主要集群,Stackdriver的预估成本大约为存储和写单独计算22000美元。另一方面预警集群DynamoDB成本约为600美元。Eaton表示:“成本节省或者成本实际取决于工作负载类型,不能在一种综合的状态中对比这些替代选择。”

截至新闻发布亚马逊未发表任何评论。

原文发布于微信公众号 - 云计算D1net(D1Net02)

原文发表时间:2014-03-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏安恒信息

全球量子通信 不再是传说

没有方便和有效地操作量子信息的内存系统,就谈不上量子计算机或量子加密技术的普及。但最近华沙大学物理系的研究人员,在普及量子技术的工作方面取得了进展。他们使用极其...

3496
来自专栏软件测试经验与教训

张老师聊面试(二)

小梅,毕业一年,从实习到现在都在一家外包单位工作,做的是手机测试和定制软件的测试,由于工作单调,且没有成长空间,因此考虑换一份工作。但几次面试都不太顺利。

951
来自专栏ThoughtWorks

2015.1 技术雷达 | 技术篇

许多项目都存在外部代码依赖,这些依赖中很大一部分是由开源项目提供的。为了确保构建过程可被重现,我们总是与固定版本的外部依赖进行集成。但这就意味着我们与这些类库的...

3537
来自专栏SAP最佳业务实践

从SAP最佳业务实践看企业管理(95)-ETO按订单设计

5、ETO按订单设计 在这种生产类型下,一种产品在很大程度上是按照某一特定客户的要求来设计的,所以说支持客户化的设计是该生产流程的重要功能和组成部分。因为绝大多...

2834
来自专栏腾讯大讲堂的专栏

【大系统小做】——理论篇

大系统小做是什么? 我们先看一个简单的例子: 舞厅要装设多色灯,有2种实现方案: ? 思考:它们各有什么优缺点? 方案1: 优点:整体性强; 缺点: 系统可靠性...

2889
来自专栏技术翻译

10必须了解托管云服务对业务增长的好处

根据MarketsandMarkets™关于托管云服务的报告,“云托管服务市场规模预计将从2017年的271.5亿美元增长到2022年的537.8亿美元,预计复...

1423
来自专栏Java后端技术栈

新的一年来自一个程序员的反思!

程序员大军鱼龙混杂,水平的高低无法简单的从一个功能完成情况来评定,同样一个需求,功能都可以完成,但是不同程序员完成质量会不一样,完成质量的好坏需要从多方面评定,...

862
来自专栏JAVA高级架构

京东架构专家分享京东架构之路

京东咚咚架构演进 咚咚是什么?咚咚之于京东相当于旺旺之于淘宝,它们都是服务于买家和卖家的沟通。 自从京东开始为第三方卖家提供入驻平台服务后,咚咚也就随之诞生了。...

4859
来自专栏云计算D1net

揭穿SaaS应用程序可取代所有遗留系统这个神话

如今,软件即服务(SaaS)应用程序越来越多地应用于大企业。公司高管想要员工使用这种应用程序的两个首要原因是: * 节省成本:公司可节省IT团队扩建构建新应用程...

2817
来自专栏数据猿

【案例】恒丰银行——大数据实时流处理平台

数据猿导读 恒丰银行针对商业银行在风险、营销、科技运维、内控管理方面对实时数据处理能力的需求,基于实时流处理相关技术,构建全行统一的实时流处理平台,有力支撑了相...

4456

扫码关注云+社区

领取腾讯云代金券