应对计算需求突增 云爆发只是泡沫?

虽然云爆发的概念听起来不错,但是将突然增加的计算需求转移到公有云中仍然存在诸多问题。

由于只需在真正使用时才支付费用,因此云爆发这种方式引发了很多人对于公有云计算的兴趣,包括高级管理层以及面临预算限制的IT经理们。混合云能够在需求高峰时将负载弹性转移到公有云当中,而当需求减少时再将规模缩减,运行在本地服务器当中。这种方式可以让大型企业不必支付高昂费用就能获得有保障的无限制和不间断服务。

很容易理解为何云爆发如此具有吸引力。在混合云模型当中,负载能够在不同云之间无缝迁移、动态适应不断变化的需求,这是IT部门及时响应业务部门需求的典型案例。然而事实上,想要让突然增加的本地负载使用距离较近、无限制的公有云资源不仅仅是一个令人头疼的问题,对于大多数企业来说,这都是不可能实现的。

“我不认为这种方式会像大家期望的那么流行,” The Virtualization Practice公司首席分析师Edward Haletky表示,“如果想要实现这种程度的自动化,企业需要绝对信任自动化机制,并且实施恰当的监控和控制。所有公司都能够做到这些吗?我知道有些公司可以,但是它们都是规模非常庞大的公司。”

云爆发面临哪些挑战

Midwestern大学的虚拟化和云架构师Bob Plankers表示,尽管云爆发的概念非常吸引人,但是在将本地应用程序扩展到公有云的过程当中依然会面临很多复杂问题。这些挑战甚至超过了云爆发本身具有的优势,因此在某些环境当中购置几台全新服务器也许是一种更为高效的办法。

“本地计算环境和公有云之间可能存在严重的网络延迟,”Plankers表示。“很多企业在考虑这种方式之前并没有评估Internet出口带宽。延迟会导致应用程序响应缓慢,而应用程序响应缓慢正是企业最应该避免的问题。”

云爆发究竟是什么?

尽管大家对于云爆发的最终目标已经达成广泛一致——处理计算需求方面的临时性快速增长——但是很多专家和分析师在其必要性方面依然持有不同意见。专家同意可以将突然增加的本地负载迁移到云环境当中,然而,他们并不认为迁移的目标只能是公有云(还可以是私有云),并且迁移和返回的过程都是自动实现的。最后,如果企业能够成功处理需求峰值的问题,那么如何称呼这个过程其实并不重要。

大多数企业的传统应用程序并不支持无缝扩展到云中。考虑到这种情况,如果企业的会计部门正在进行年终结算,那么肯定会导致ERP系统出现负载峰值。IT管理员也许会考虑分配一个新的前端引擎来处理这种需求,但是其仍然需要和后端SAP系统进行通讯,药物研发公司AbbVie基础架构师Keith Townsend表示。

“如果数据仍然保存在本地数据中心,那么在云中使用新的引擎并不会起到任何作用,”Townsend说,“相对来说在私有数据中心当中创建新的虚拟机将会是一种更加简单和廉价的方式。”

网络是采用现代方式处理云爆发的另外一种主要挑战之一,但是这种挑战不止限于传输延迟和连接速度而已。如果应用程序在本地服务器和公有云之间同时运行,那么安全性会变得更为复杂,Townsend表示。

“(如果在本地数据中心)我可以在网络层的两台防火墙当中设定两条策略,监视两台Web服务器之间的流量,但是如果我将突然增加的负载转移到云中,那么谁来保证安全性、谁来实现日志记录?”他说,“如果对我进行外部审计,我该怎么办?”

即便IT部门能够应对基础架构方面的挑战,云爆发仍然会带来大量管理和业务方面的问题。在很多情况当中,性能的提升往往伴随着复杂性增加,Haletky表示。

“许多人都谈论这个美好的故事,但是我不知道究竟有多少家企业真正采用了云爆发这种方式,因为你必须拥有非常高的自动化程度,”Haletky说道,“多少家公司能够达到那样的自动化程度?Netflix公司可以,但是所有公司都能像Netflix公司一样吗?”

如果采用云爆发这种方式,那么需要提前计划,也就是在云中提前部署虚拟机镜像和数据,以便在应用程序出现负载峰值时公有云能够及时接管部分负载。对于能够预测未来需求的业务来说,这并非是不可解决的问题,但是管理员难以决定的是到底需要公有云提供多少性能以及为这些随时就绪的数据愿意支付多少费用。

讽刺的是,使用云爆发这种方式的最初目的之一就是缩减费用支出、减低成本,但是最后却事与愿违。

“如果我将某项任务自动化,但是并没有让其完成之后自动关闭,那么就可能会导致整体开销上升,”Haletky说。“处理负载爆发的整体思路就是在需要时运行,在一切正常之后返回到默认状态。如果从Amazon购买20台新的Web服务器,那么每小时都会产生巨额开销。”

为不稳定的应用程序制定计划

处理计算需求突增最简单的,通常也是最廉价的解决方案仍然是传统方式,在本地预留出足够的服务器性能,专家表示,这种方式并不一定意味着购买新的服务器。评估是否需要将突然爆发的负载转移到云中的第一步就是评估当前资源的使用情况,Townsend表示。

“在很多情况当中,我们应该关注的重点不是如何将突发负载迁移到云中,而是检查企业的现有工作效率多么低。”Townsend说道,“让我们评估一下现有资源,之后合理调整资源以便拥有足够的性能来完成所有任务。”

对于那些遇到更大规模需求变化或者真的缺少性能的企业来说,使用Puppet和Chef这样的自动化工具,配合虚拟化和云管理平台,可以帮助它们构建一个灵活的混合云。然而,现在有很多新的厂商尝试采用独特方式来降低云爆发的复杂性。

Ravello Systems公司帮助企业映射应用程序依赖关系、管理网络配置、将整个应用程序栈克隆到云当中。然而,大多数用户并没有选择将生产环境当中的突发应用克隆并迁移到公有云当中,而是采用一种不同的方式,Ravello公司产品市场总监Shruti Bhat表示。

“我们看到用户仍然将生产环境应用程序放在自己的数据中心当中,而将其他环境当中的负载迁移出去,这样就能够为生产环境预留足够性能和空间,比如将开发和测试环境迁移到公有云当中,”Bhat说,“这仍然算是云爆发的一种方式,但是这样做就不用再担心性能问题以及通过VPN连接应用程序和将数据保存在其他位置所带来的安全风险了。”

Ravello的客户包括在线游戏公司888poker,将QA和证书环境迁移到了公有云当中,还有两家大型银行使用Ravello的产品运行网络安全实验室克隆环境。当本地性能达到峰值时,Red Hat也在其OpenStack培训课程当中使用Ravello的产品,为学生提供多服务器实验环境。Bhat说,“Red Hat发现每次学生登陆的时候,他们都需要分配一个快速建立的OpenStack环境,如果为每位学生分配5到6台服务器,那么数据中心的资源将会很快耗尽。当学生登录的时候,他们会让学生访问数据中心当中的服务器,而当数据中心当中的资源用尽的时候,他们开始让学生访问Ravello所提供的OpenStack资源。”

位于以色列的初创公司Velostrata希望帮助企业在需要时将本地突增的负载迁移到AWS(Amazon Web Services)当中,通过将计算和数据分离来解决数据迁移延迟和合规性问题。“将数据移动到云中需要花费很长时间,并且移动这些数据会面临安全或者合规性风险,” Velostrata公司CEO Issy Ben-Shaul表示,“我们提供的技术可以将虚拟机镜像迁移到云中,并且在不影响性能的情况下保证这些镜像能够访问企业本地数据。”

该公司的产品将会在今年内全面上市,包括vCenter插件、调整虚拟机镜像使之更加适合于AWS环境、并且以流的形式将虚拟机镜像传输到云当中。这种流机制可以保证虚拟机快速启动,其工作原理类似于流视频,在全部下载完成之前就能够开始播放,Ben-Shaul说道。运行在AWS当中的虚拟appliance作为虚拟机的目标存储,提供去重复化功能,并且能够缓存常用数据。

“我们只对所需的部分进行流化。在3到5分钟内,就可以将一台处于运行状态的本地虚拟机顺利迁移到云当中,”Ben-Shaul表示。

尽管新出现的工具已经能够按需将突然增加的应用程序需求流化并且迁移到公有云当中,但是这种实践过程也许并不会得到大范围推广。云爆发和应用程序设计问题一样,都是基础架构交付问题。应对传统应用程序需求突增问题必然会面临技术和管理方面的挑战,越来越多的企业级应用程序厂商开始选择使用SaaS,并且随着越来越多的公司投资公有云,他们也许会发现从开始就考虑到扩展性、针对云开发应用程序十分简单,而不应该是将本地突增的应用程序需求转移到云中。

原文发布于微信公众号 - 云计算D1net(D1Net02)

原文发表时间:2016-04-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Golang语言社区

优秀的代码是一个循序渐进的过程

近些年来,越来越多的人开始转向敏捷开发,而且这些敏捷开发的技术已不再新鲜,大多都是在80和90年代设计形成的。但是,最近几年,程序员,特别是一些商业顾问,架构...

2806
来自专栏靠谱PM

一个需求从提出到落地的过程

这篇文章主要借复盘天猫超市优惠券功能来聊下,一个优惠券功能的需求,从需求的提出到落地的一个复盘,有每个步骤的实操,这里的需求是明确的,后面有时间做一个需求分析的...

3022
来自专栏Java学习网

如何定位与唤醒沉睡用户

典型的沉睡用户定义,是指一段时间没有使用你的 App 的人。App 的目标是鼓励用户更频繁地使用,对于大多数 App而言,「一段时间」相对较短:几个星期或者一个...

3146
来自专栏程序员互动联盟

项目上线后出了问题并造成损失,原因是代码逻辑问题,责任应该由程序员承担吗?

只要是程序就会存在漏洞,成熟的程序相对漏洞会少一点,上线之后出了问题并且造成损失,表面上看是程序员代码直接导致的,作为实现者本身来讲是负有一定责任,但如果把所有...

2431
来自专栏京东技术

京东统一发布平台J-one | 高效交付的秘诀就是Ta

自2016年7月份上线以来,京东统一发布平台J-one已经经历了京东4次大促洗礼,支撑全公司服务端业务系统90%以上的发布,从编译、配置、到发布,提供完善的发布...

3826
来自专栏云计算D1net

IBM与微软在云平台方面达成合作协议

IBM与微软已经达成一项在云计算领域合作的协议,微软Azure云服务将能够使用IBM中间件,IBM Cloud云服务也能够使用Windows Server和SQ...

2965
来自专栏织云平台团队的专栏

从鹿晗关晓彤恋情事件看运维的节假日准备工作

鹿晗关晓彤公布恋情,微博服务短暂不可用。那么,面对这种突如其来的节(sa)假 (gou)日(liang)热点,该如何才能做到有条不紊,高效运维呢?

1.9K1
来自专栏Java学习网

优秀的代码是反复修改后创造出来的

优秀的代码是反复修改后创造出来的  近些年来,越来越多的人开始转向敏捷开发,而且这些敏捷开发的技术已不再新鲜,大多都是在80和90年代设计形成的。但是,最近几年...

28610
来自专栏张善友的专栏

ASP.NET MVC的SNS软件Spacebuilder

SpacebuilderV4.0 展示了全新构建的微博、贴吧、群组、日志、问答、相册、积分商城等社区功能,Spacebuilder开发团队却在V4.0正式版发布...

1986
来自专栏云计算D1net

停止疯狂:私有云的真正利润

私有云在完成需求前需要资本支出投入,这也意味着企业实际上需要进行更大的投资,这种投资大于针对计算资源部署的传统IT模型。因此部署基础架构的最初成本并非私有云模式...

3629

扫码关注云+社区

领取腾讯云代金券