前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >VMware的灾备与双活----我在vForum 2015分会场的分享(1)

VMware的灾备与双活----我在vForum 2015分会场的分享(1)

作者头像
魏新宇
发布2018-03-22 11:17:34
2.6K0
发布2018-03-22 11:17:34
举报

本次VMware vForum大会(北京站和上海站),有幸和同事Alex You一起分享了《如何基于虚拟化构建双活数据中心》课题。我主要负责介绍了VMware灾备与双活方案。很多同学表示出来了较大的兴趣,因此写出来共享给大家,由于内容较多,本次先发布灾备部分内容。

一.灾备

谈到灾备,首先谈到灾害。在过去几年中,全球各国经历过许多大范围的灾难,如海啸,地震等。这些是我们从新闻上得知的比较重大的示例,但同时还存在很多范围较小的中断示例,如数据中心断电、数据中心网络中断、主机故障等。行业研究显示,那些经历大规模IT中断后, 无法在特定时间内恢复其IT系统的公司将面临破产。对于剩下的公司而言,中断时间每延长一小时,都必将产生严重的财务损失。那么,我们可以考虑一个问题, 1个小时,对于企业来讲值多少钱?

根据相关机构统计,媒体行业停机一小时的损失是6.9万美元;对于零售行业停机一小时的损失是11.3万美元; 对于金融行业的信用卡授权业务,停机一小时的损失停机一小时的损失高达645万美元. 除了经济损失,业务中断还有导致对公司声誉造成无法估量的无形资产的损失. 而采取灾难恢复方案的总花费,平均只有100万美元。所以说, IT 业务系统的连续性对于金融行业来讲尤为重要!

二.容灾

谈到容灾,VMware核心的解决方案是Site Recovery Manager,简称SRM。与传统的容灾解决方案相比,SRM有类似的地方,也有它独特的优势。SRM本质来讲,也是通过控制站点间存储底层存储复制关系或VMware VR复制关系来实现灾备切换。其中VR是VMware提供的免费解决方案,它可以通过在站点间相同或不同存储之间复制虚拟机的VMDK来实现数据保护。VR通过网络复制数据,RPO最短15分钟。如果对RPO要求很高的话,可以采用存储同步同步复制。

当一个站点发生故障时,SRM会自动将故障站点的虚拟机在灾备站点重启,实现灾备切换。虚拟机切切换到灾备站点,IP地址可以不变或者改变,站点切换时还可以定义虚拟机切换的优先级。除此之外,SRM还通过快照技术支持切换演练。

至于在SRM方案中,选择使用VR还是底层存储复制,我们需要从成本、管理、性能三个角度进行考量。SRM+VR成本低,易于管理,但RPO最短为15分钟。SRM+存储复制成本高,但RPO低,或者说是0。 但对带宽要求高。因此,我们在设计方案时,首先应充分考量应用SLA的要求。针对不同的应用,采取不同的方案。

前面我也提到,SRM一个很大的优势是继承了VMware机基因,与vCenter统一集成,操作非常简单。下面我用实际案例进行说明。

三.SRM切换

l 基于VR的SRM切换

1. 模拟主站点发生故障,即给主站点ESXi断电,我们可以看到主站点虚拟机已经断开。

2.在灾备站点,选择恢复计划(需要平时创建好)。

3.检查虚拟机复制状态

4.执行恢复计划里的“恢复”操作,“恢复类型”选择“灾难恢复”,“我知道该过程将永久改变虚拟机及受保护数据中心和恢复数据中心的基础架构”

5.点击启动

6.灾备切换开始,过一会,虚拟会在灾备站点重启。

l 基于存储的SRM切换

1.执行恢复计划RecoveryPlan01

将主站点主机、网络强行断电,在容灾站点执行恢复计划RecoveryPlan01。

2.执行恢复计划会中止主站点的VM,中止阵列复制。

3.恢复计划完成后,主站点会被视为已失效,底层阵列的复制也被中止。容灾站点的ESXi会在VC的指挥下挂接之前一直在做同步的LUN(与主站点做同步复制时这些LUN是无法被ESXi挂接的),然后启动受保护的VM。

有一个真实的案例,可以说明客户如何在灾难发生之前,利用SRM将企业应用迁移走, 而使应用免受灾难造成业务损失。

客户两个站点分别位于日本两个城市。主生产在数据中心1,灾备站点在数据中心2。

(1)在某一天下午2:46,距离主数据中心45英里以外的海域发生地震,地震随后引发了海啸。

(2)在3分钟后,主数据中心当地政府发布海啸预警。

(3)几分钟后,该公司IT部门迅速作出决策,进行灾备切换。

切换的时候,根据恢复计划的设置,Tier1关键业务虚拟机先进行切换。关键业务切换后,tier2和tier3虚拟机再进行切换。

(4)当海啸在数据中心1所在地发生之前,客户数据中心1的业务都已经切换数据中心2,也就是灾备中心。成功避免了由于灾害影响到业务。

总结:无论从容灾的成本、可操作性、可维护性来讲,SRM无疑是vSphere虚拟化环境下最好的容灾方案。

接下来请欣赏-VMware的灾备与双活----我在vForum 2015分会场的分享(2)--双活篇。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-12-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大魏分享 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档