专栏首页Forrest随想录多云一定会起到容灾作用吗?

多云一定会起到容灾作用吗?

前面两篇讲了容灾建设的一些概念,没看过的朋友可以看一下:

在二、三篇中,在容灾建设上,我们已经讲得差不多了,一个很显著的结论就是:

容灾这个事情,跟多不多云没有任何关系,单个云厂商的公有云里照样可以保障容灾,复杂度还要比多云低一些,也更具备可操作性。

既然结论有了,那为什么还要讲多云呢?

只是想从另一个角度看看,如果选择多云,实施层面会有哪些问题和难点,后面再看方案的时候,也可以更务实一些。

分几个场景讲:

第一,如果只用到了公有云的IAAS层。

也就是只用到了虚拟机这样产品,上层的任何数据库、缓存、消息以及应用,都是自己在虚拟机上部署的,没有用到云上的PAAS的产品。

如果是这样,其实A云、Q云,还是M云,只是基础设施IAAS提供方不一样而已,本质上并没有什么差别。

所以,这种仅IaaS应用的场景下,多云方案完全可以退化成不同IDC或不同AZ间的高可用解决方案

上篇,我们提到过,如果是同城不同AZ,在物理距离上足够远,电力和网络设施也完全是独立的,并不会因为单个AZ故障,导致另一个AZ故障。

这种情况下,两个AZ同时故障的概率是非常小的,但是如果非要说,来个大范围地震、海啸,或者整个城市被黄浦江淹了,让原子弹给炸了,那也没招,但是实际概率有多大,算算就知道了。

所以,多云不是不行,但是这里隐含的前提条件是,业务只使用了云上的IAAS层

多云的必要性大不大,是不是单云的不同AZ方案更划算,其实评估下就清楚了。

况且,这里多云之间跨云厂商的专线拉通,这里面又是很灰色的意识事情,成本高,各方利益博弈,而且出了问题,到底算哪头的也不知道,最后就是不了了之。

第二,如果业务不仅仅用了IAAS层,还用到了PaaS层的产品,比如数据库、缓存、消息、云通信等等。

业务一旦跟这些产品耦合,那这种场景就复杂了,就目前情况看,多云基本不太可能。

因为目前从各大云厂商的PaaS产品来说,并没有统一的标准,也不太可能有统一标准,所以提供的API也好,还是SDK也好,基本都是根据自己的产品设计封装出来的,即使是原生API,实际使用的时候,也会有大大小小的差别。

所以这种情况下,对于用户就要有大量的兼容类开发工作要做,甚至有些场景会对业务逻辑有侵入。

从管理维度来说,也增加了复杂性,因为一台阿里云的RDS和一台腾讯云的CDB性能指标、所处网络环境、处理能力等,也没法完全标准,定价也不一样,等等等等,各种不同。

管理复杂度也会增大很多,复杂度上升,必然带来成本上升,是不是划算,不知道。

所以,从这两个角度讲,业务一旦依赖了一个云厂商的PaaS产品,基本也就跟这家云厂商绑定了,基本就不具备做多云的条件了。

第三,未来会是什么走向?

其实IaaS层跟业务基本没有耦合,这个不会太大的障碍。

前面说的,主要问题还是在PaaS层,各厂商无法统一。那怎么办呢?可能这么几条路:

  • 期望云计算这个行业有个大一统的标准出来,所有云厂商都按这个标准来做,但是这个很难。
  • 有一类公司出来,专门做兼容各大云厂商PaaS产品的中间层SDK出来,对于企业和客户来说,也算是一种统一,但是这个也很难,因为这样的产品做起来不难,但是很麻烦,而且有多大市场也不好说,所以有点费力不讨好。
  • 期待面向应用的云产品能力越来越强大,比如现在的Spring,在AWS上就有Spring for AWS的版本,什么意思呢,就是我们如果用的是AWS的服务,不管我们用EC2,S3,还是什么ElasticCache或者RDS等等,通过Spring的API直接访问,对业务来说,这些产品组件就是一个对象而已,直接new出来,直接用。不过现在spring也只有for aws,并没有for其它云。如果按照这个模式,spring家族融入到整个云计算生态中,成为应用层云化实时上的标准,这个问题也会有一个不错的解决方案,不知道会不会有朝一日有大一统的机会。

第三部分简单总结一下,是想表达什么意思呢,就是未来短期貌似还看不到在应用层讲各大云厂商PaaS产品统一的希望。

第四,目前业界的多云现状。

这里仅说我调研和了解到的情况,目前业界大多数公司所谓的多云,是将一些无状态的应用或接入层分几个云部署一下,只是容量上的冗余建设,但实际并起不到容灾作用。

这么做无非两个原因:

  • 通过多云的引入,带来的竞争,从而带来成本上价格比拼,以及云厂商服务质量的提升。像前面说的,如果一旦跟一家云的PaaS绑定,只能选择一家云厂商,没有了竞争,在很多方面就少了博弈的筹码。
  • 单云的节点分布问题,比如在海外,早期AWS的节点质量明显会好一些,服务也完善,所以有些海外接入层的需求就选择AWS,但是国内有可能还是腾讯云、阿里云等等。当然现在国内的云在海外的布局也已经做的很不错了。

最后,总结一下

多云跟容灾和高可用完全两码事,不要扯在一起,多云也解决不了容灾和高可用问题,最终还是得自己的技术体系支持才可以。

多云不解决整体容灾,但是可以考虑局部高可用,案例见上面。

多云模式其实是一个管理复杂度很高的事情,甚至在业务与云的耦合层面,就已经决定了一个系统压根不具备多云建设模式。

但是业务所在的主要的云厂商故障,多云一样还是没用,比如前面阿里云分布式存储IO HANG导致的大面积故障,即使有腾讯云、AWS或者其他人做备份,会真的有用吗?


我开了一个讨论群组,主要探讨SRE、运维、云计算、技术管理等方面的内容,现在已经聚集了各行各业运维领域的专家,不定期福利+深度讨论。空位不多,为了保证群的价值,定期排除不发言,不讨论的同学。

如果你想入群,关注公众号,就可以看到我个人微信号,加我时注明姓名+公司。

本文分享自微信公众号 - 聊聊SRE(forrest_thinking)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-03-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 云游戏全景分析

    从2019年开始,IT行业普遍焦虑,大家都讲不出4G的新故事,只能寄希望于5G应用。更多人对云游戏的“火爆”,是对所有和5G沾边的新闻一样盲目的狂热,至少不能显...

    赵成
  • 脱水又泼水--远程办公需求分析

    疫情之下,在线办公突然火热,很多人都大呼小叫看到了新机遇。但是看到机遇就能抓住机遇吗,本文带大家分析远程办公这个需求。

    赵成
  • 与其说建设CMDB,不如说建设IT资源图谱

    在运维人员看来,CMDB是一个绕不开的字眼。在ITIL时代,太多的CMDB落地项目,但鲜有成功。而我之前有一个观点,CMDB中的配置字眼要从这个里面去掉,重新给...

    赵成
  • “云上”企业的“多云”挑战

    经十余年的发展,“云”已经成为了今天企业级IT的事实标准。从十年前部署在企业内部专有网络中,通过虚拟化将计算存储和网络资源打通的私有云;到来自第三方,部署在企业...

    SDNLAB
  • “云上”企业的“多云”挑战

    历经十余年的发展,“云”已经成为了今天企业级IT的事实标准。从十年前部署在企业内部专有网络中,通过虚拟化将计算存储和网络资源打通的私有云;到来自第三方,部署在企...

    CloudBest
  • 2019年IT领导者应该关注的5个云计算趋势

    使用来自多个云计算服务提供商的多个云服务是多云的最直接定义,意味着许多组织几乎都会用“多云”策略。随着多云战略变得更加重要,特别是对于多云和混合云基础设施来说,...

    静一
  • 系统编程语言Rust特点介绍(1)

    最近在学习Rust语言,感觉这门语言有点意思,因此写一篇文章分享。我不会去介绍Rust的基本语法,什么变量声明,if..else..,循环等等。这些东西,文档介...

    glinuxer
  • 干货 | 多伦多大学博士生赵舒泽: 如何在FPGA上实现动态电压的调节?

    AI 科技评论按:说起 FPGA,很多人可能都不熟悉,它的英文全称为 Field Programmable Gate Array,即现场可编程门阵列,也被称为可...

    AI科技评论
  • 基础知识普及-网络抓包工具(tcpdump)

    ping需要建立连接吗?tcp的数据传递一定需要ack吗?只通过ip地址和port就能把数据发送到目的主机吗?(这个面试常问) 微信登录是如何认证的?附近的人...

    用户5166556
  • FPGA入门

    FPGA简介 FPGA是英文Field Programmable Gate Array的缩写,即现场可编程门阵列,它是在可编程阵列逻辑PAL(Programma...

    企鹅号小编

扫码关注云+社区

领取腾讯云代金券

玩转腾讯云 有奖征文活动