IDC时代,业务对网络容灾参与较少,主要依赖数据中心网络容灾建设程度;当到了云的时代,云服务商将底层网络能力产品化后,云上客户更多参与网络容灾建设,提升业务稳定性。 本文从云网络概述,云网络容灾复杂度以及典型案例来介绍云网络容灾建设。 1.云网络概述 云网络概述主要分为云服务商基础设施网络架构和云产品两部分,让云上客户更加深入了解云网络,用好云网络。 2)跨区或者跨地域云基础设施容灾能力。 通常云服务厂家数据中心建设均有容灾能力,这里建议还是选择大厂。 3)IDC到云上网络高可用建设。 混合云容灾模式,这里考虑到IDC和云上线路容灾情况,一般建议两条专线接入不同的POP点来进行容灾建设;同时建立VPN或者GRE公网逃生通道来紧急恢复业务。 image.png 3.2 混合云网络容灾 混合云网络容灾分为两个部分: 1)idc和云机房之间线路容灾,主要线路分为专线和VPN。
本文结合云平台公网能力,从网络平台角度来分析容灾建设可行性。 2.公网出口容灾方案 2.1 IDC和云平台出口互为主备 正常情况下,IDC和云平台公网出口流量是烟囱式,互不交叉;当IDC公网出口异常,流量切换到云平台,同样云平台公网出口异常,流量切换到IDC。 云平台NAT网关不支持流量导入,需要企业在VPC自建流量转发系统,推荐流量出口选择直接绑定EIP模式,流量更可控。 整体公网出口容灾方案如下: image.png 2.1.1 云平台切换方案。 2.1.2 IDC容灾切换方案 正常情况下,IDC业务流量通过NAT访问公网,如上路绿色线条标识。 2.2 IDC机房公网出口容灾方案 正常情况下,IDC和云平台公网出口流量是烟囱式,互不交叉;当IDC公网出口异常,流量切换到IDC备用公网出口通道,同样云平台公网出口异常,流量切换到云平台公网出口通道
领8888元新春采购礼包,抢爆款2核2G云服务器95元/年起,个人开发者加享折上折
本文从容灾概念,决策因素,典型案例和方案对比进行说明,希望容灾方案的选择有所帮助。 1.容灾概念 将容灾这个词,分开来看“容”和“灾”。 “灾“可大可小,某种意义上来讲就是"单点"问题,例如核心业务部署单台服务器上,这台服务器宕机起不来了,对业务来讲就是一场灾难;而“容”,是解决各种"单点"问题。 典型案例 虽然这里对“容灾”概念进行扩展,一般指同地域以及跨地域粒度的容灾;以云上客户案例同时结合腾讯云产品能力,分别对同城容灾,异地灾备以及异地多活进行说明。 以下是云上某个金融公司异地容灾架构: 1)接入层和业务层均使用低配以及业务单台服务器部署方式,主要提升业务快速扩容能力,一方面主可用区异常,借助腾讯弹性伸缩AS能快速扩容,另一方面业务发布版本在不同地域保持一致 2)该数据层使用云上PAAS产品,云上产品均支持异地容灾能力,同时操作便捷。如CDB和COS均通过云上控制台按钮式方式建设异地容灾能力;而对于es通过ccr方式进行数据复制。
安全容灾解决方案同业务容灾解决方案的区别: (1)业务容灾解决方案倾向业务架构内因解决问题。 业务容灾问题发生的普遍原因是基于业务访问量,架构负载,业务逻辑等内部可用性层面导致,解决思路多以异地灾备,混合云多活灾备, 数据迁移同步等层面解决。 (2)安全容灾解决方案倾向安全行为外因解决问题。 二.主机安全面对的灾有哪些 1.核心灾难:勒索病毒 (1)数据库被删勒索 image.png (2)数据恶意加密勒索 image.png 2.挖矿木马 (1)服务器可用性问题:高占用CPU进程。 清除内核挖矿木马的代价是:清除病毒同时可能导致服务器宕机。 灾后影响:(1)业务服务崩溃,系统不可用。 (2)消除不净,病毒反复重生,耗散人力。 服务于 CIA全过程 五.云主机安全容灾解决方案 1.第一步:快照备份,全盘快照 (1)创建云上定期快照:https://cloud.tencent.com/document/product/362/
腾讯云跨地域容灾方案DNSPod+CLB.ppt D监控介绍:https://support.dnspod.cn/Kb/showarticle/tsid/16/ D监控切换规则:https://
随着业务对持续性要求越来越高,云上不少企业对跨AZ或多地域的容灾建设有强烈的诉求。 通常对组件容灾能力建设和验证会花费大量时间,如果测试不符合预期,对之前调研、部署以及测试人力和时间成本带来较大耗费。因此借助云平台能力“一站式”提升系统容灾能力,助力企业降本增效。 本文也平台容灾能力建设优势、云上容灾典型方案以及一站式构建三个方面来进行详细的说明。 1.云平台容灾建设的优势 借助云平台能力有效提升容灾建设效率,同时能减少建设成本。 1)降低容灾建设的技术门槛。 以腾讯云为例,构建同城双活的数据库单写整体业务部署架构: image.png 2.2 异地灾备 异地容灾主要满足客户数据安全需求。 以腾讯云为例,构建异地灾备整体架构: image.png 3.一站式构建容灾能力 关于云上容灾能力概况,以腾讯云为例如下: 产品 多可用区实例 多地域实例 CLB 1.控制台支持购买多可用区实例。
在此架构下,一般建议至少买两台云主机,挂在负载均衡下面,避免单云主机出现业务中断。同时数据库与web、应用服务器不建议放在同一台云主机上,避免互相争抢资源,云端建议买RDS Paas服务,减少麻烦。 1、通过智能DNS服务,实时两个SLB的连通性进行检测,当主用SLB中断时,进行秒极的检测,将备用SLB同步至全网的DNS服务器。 如果对于金融级的客户,还会考虑异地的灾备。则采用以下的架构。保障双活的公有云中断时,异地的私有云还能够在一定的时间内接管业务。 ? 五、数据灾备级的容灾方案 对于以上的方案,投入的代价较大,例如需要支付双活数据中心的高速通道费用、相同配置的云主机费用。 这样当业务系统中断时,可以选择在云端恢复、或线下私有云恢复。 ? 2、例如下图,也可以通过纯软件的方式进行灾备,直接将备份的文件放下云端、或线下私有云。 ?
MSHA 云原生多活容灾解决方案 [1] ,也发布了混合云多活容灾产品能力。 混合云容灾目标 业务容灾需求归纳如下: 云上云下互容灾,切换 RTO 为分钟级。 期望云上云下相互容灾,继续发挥 IDC 的价值,且不 100% 依赖于云。 解决方案 结合业务容灾需求和混合云 IDC+云形态的特点,采用应用双活架构能够较好的满足业务容灾诉求。 改造内容 应用上云 选择跟自建 IDC 较近的阿里云地域,云上完全冗余的部署一套应用、中间件和数据库,以便搭建云上云下双活容灾架构。在这个 Demo 案例中,选择杭州 Region 作为容灾单元。 总结 在本篇文章中,我们介绍了 MSHA 多活容灾助力企业进行混合云应用双活容灾建设的实践案例,给出了容灾架构建设实践方法,同时利用 Chaos 故障演练产品注入真实故障,来验证故障场景业务容灾能力是否符合预期
一般会考虑三种线下灾备方式: 1、本地容灾:业务高可用和读写分离,以提高业务连续性 2、同城容灾:兼顾业务连续性和数据安全,应对地区级以 3、异地容灾:以数据安全为目标,应对地区级数据风险。 传统模式下企业的数据容灾建设方案 灾备是一项综合系统工程,灾备技术涉及到数据的复制、数据及应用的切换、数据的删除、数据的加密与传输、数据存储等多个技术的具体应用,系统容灾建设中,最重要的是数据容灾,目前 阿里云数据容灾建设方案 随着云时代的到来,大多企业在公有云上建立自己的数据中心,或者在本地建立私有云,或者公用云与私有云结合的混合云,不管以什么形式存在,灾备的建设一定会考虑云的因素。 企业可用自己设计备份或灾备策略,实用数据库本身的技术,把数据容灾到云端,也可用实用云厂商的方案,在线下和线上之间进行灾备实施,或者在云山进行灾备设计。 腾讯云数据容灾建设方案 222.jpg 腾讯云数据灾备架构图 腾讯云数据灾备优势: ---- 1、高兼容性:同时支持虚拟环境和物理环境中的备份数据成功上云,覆盖主流虚拟机、数据库、邮件系统和非结构化文件
接着上篇《做容灾,双活、多活、同城、异地、多云,到底应该怎么选?》,这篇聊聊公有云上应该如何建容灾,跟我们自建机房有什么区别,没看过的同学,建议先从上篇文章看一下。 做个简单总结就是,要想起到容灾效果,优先做到同城双活,再考虑异地双活或多活。从这个铺垫往下,谈谈如果我们上了云,高可用和容灾策略应该怎么选择。 我从几个方面来讲: 第一,先理解几个公有云的通用概念。 第三,关于云产品层面的高可用应该怎么做? 上面我主要讲的还是基础设施层面的内容,不同的AZ完全可以满足要求。 或者说的简单点,很多产品都是AZ级别的,在一个AZ不可用,但是可以跨AZ容灾访问。 就是在使用这类Region级别的产品,必须要要求在另一个Region有对应的容灾集群,出问题能切过去。 几个结论: 第一,云上做容灾,做高可用,先搞清楚云的几个关键概念,比如Region、AZ和IDC,以及它们之间的关系。 第二,云上的双活就选同城不同AZ即可,多活就选多Region。
9.png 三、腾讯云容灾解决方案 10.png 上图中三种应用场景是大家耳熟能详的,从用户使用角度来理解容灾场景,则有如下两种场景: 跨可用区容灾 跨可用区容灾需要保证一个CLB实例的后端服务器 即使CLB支持添加属于不同可用区的CVM,用户也是购买两个CLB实例来实现跨可用区容灾,用户可以使用云解析将注册系统的域名解析到上面的两个CLB实例,实现CLB的调度。 负载均衡CLB产品本身没有提供这样的能力,跨地域容灾的能力是通过云解析DNS+DNSPod产品来实现的,云解析DNS产品提供了解析的能力,DNSPod提供容灾的能力,网站宕机后自动切换DNS记录,多种切换算法 同城双机房(跨可用区容灾)架构 参考上面高可用基本架构3 异地(跨地域容灾)架构 11.png 两地三中心架构 12.png 补充,要实现所谓的容灾功能需要依赖云上产品的数据同步能力: CVM镜像: ,混合云容灾方案参考下一期的分享。
业务上云后,不只是RS上云,接入层也换成了云上的CLB,这里记录下业务上云后,服务端渲染容灾相关的问题解决。 在接入层配置合适的容灾规则是比较合理的。目前绝大多数的接入层都是基于nginx改造的,或者兼容nginx的配置语法(例如腾讯云的CLB)。 ,腾讯云的CLB是不支持配置@开头的location的,那如何满足我们的容灾需求呢?? 云上配置 腾讯云的CLB上,只能使用一些技巧来满足我们的容灾需求。这里用nginx配置简单说明下,下面是clb的配置。 @开头的location配置,目前暂时先用这个小技巧解决nodejs同构服务端渲染的容灾需求,有什么更好的解决办法,欢迎评论区一起交流下。
因此,云化数据中心的容灾建设也相应地从面向项目的传统容灾建设方式转变为面向平台的容灾建设方式。 云化数据中心 (1)在存储虚拟化设备上激活所有同步镜像的虚拟卷; (2)在灾备中心的云平台中进行服务启动和资源扩容,并按照生产环境进行匹配; (3)网络切换,更新DNS服务器,将应用外网地址变更为灾备中心地址 待生产中心恢复后,系统回切流程为: (1)启动从灾备中心向生产中心的存储镜像同步; (2)在维护窗口,停止灾备站点的应用,启动生产中心的应用系统及数据库; (3)网络切换,更新DNS服务器,将应用外网地址变更为生产中心地址 例如,在保证数据同步备份的前提下,灾备中心的服务器资源在平时可用于开发测试、质量保证、甚至一部分非关键业务;在灾难发生时,则可由云管理平台快速进行灾备环境的快速扩容和软件自动部署以匹配生产环境。 综上所述,云化数据中心的容灾方案具备以下优势: •一体化的灾备管理 •通过云平台进行统一配置和调度; •支持快速的自动容灾切换流程; •应用级容灾的快速实现 •自动完成同步和异步的数据备份; •有效节省容灾投资
传统容灾技术的核心停留在数据搬运的层次上, 忽略了面向云的特性和业务应用的内在重构。 混合多云以 及云原生的发展趋势, 给容灾理念提供了新的发展方向和思考。 (1) 基于混合多云的容灾 基于多 Region 多 AZ 架构的高可用设计让原本复杂的容灾架构更多的由云本身实现, 极大的降低了对特定存储数据库的强依赖以及容灾设计的复杂性。 混合多云容灾体系支持的场景不仅仅包括同构云之间,同时包括跨异构云的容灾、私有云 / 物理 IDC 到公有云的混合云容灾等等。 图片异构云容灾,从物理维度极大的提升了整个架构的高可用性,分散了绑定一朵云带来的系统性风险。 异构容灾需要解决不同云对接的兼容性和复杂性问题。 (2) 基于云原生的容灾 容器和 K8S 等技术引领了云原生的变革,相比于传统应用的静态部署,云原生架构天生的动态编排特点让传统的容灾技术失效。
项目名称:杭州市政务云容灾备份项目 采购需求: 1、同城应用级容灾备份 在杭州市已有云资源生产中心基础上,新购买1个可独立承担关键系统运行的云资源容灾中心服务,双中心具备基本同等业务处理能力,并通过高速链路实现数据实时同步和业务流量分担 ,生产中心灾难发生时可进行应急切换容灾中心,保障业务连续运行和数据不丢失。 目标将29个重要应用系统分别部署到两中心,在不改变现有业务架构的情况下,充分利用现有政务云能力实现同城应用级容灾备份。 2、异地数据级容灾备份 现有华通政务云和电信政务云分别部署数据备份软件,按照《灾备指南》要求,将等保三级及以上101个应用系统数据通过数据备份软件,同步至省本级异地数据级容灾备份中心(设在金华市)。
更准确:无代理模式下,数据从源端服务器直接进行备份,不存在代理服务器可能对数据进行修改或者丢失的情况,同时降低了传统代理模式下,可能可能出现的数据传输中断或传输错误的风险。 低成本:无代理模式无需代理服务器和备份存储设备的维护成本,同时也可以降低人力和物力资源的浪费。 配置容灾平台 (腾讯云) (1)左侧菜单栏点击 容灾平台设置,在左侧点击选择 腾讯云 选项 图片 2)按以下步骤填写信息,创建<云同步网关>组件 该步骤会在认证完成后自动在腾讯云认证租户下启动一台云主机实例 图片 选择容灾主机启动时数据同步时间点(快照),并点击 确定 按钮,开始主机实例启动 提示 : 该动作会按照当前这台容灾主机的容灾配置时设定的容灾参数,在容灾平台腾讯云上启动一台实例,即为容灾到云上的主机 【自动化容灾】 HyperBDR云容灾作为基于云原生的业务级别容灾工具,采用Boot in Cloud技术,深度对接云平台和虚拟化平台,支持高度自动化的异构平台容灾,灵活度更高、可扩展性更强,可充分利用云优势
为了满足客户对数据可靠性、服务稳定性及容灾方面越来越严苛的需求,腾讯云Elasticsearch于近期推出了集群跨可用区容灾的功能。目前腾讯云Elasticsearch集群支持跨两个可用区部署集群。 由于开启多可用区容灾的集群,必须开启专用主节点,且最小三个,所以能支持多可用区容灾功能的地域必须最少支持三个地域。 目前仅有部分大地域如北上广支持多可用区容灾的功能,其他暂时不开放的地域随着腾讯云机房的建设,我们也会持续的加入这个功能。 集群多可用区容灾原理 数据节点 为了使多可用区容灾的功能生效,用户需要遵守以下原则: 购买集群的数据节点个数为可用区个数的倍数,例如选择两个可用区容灾,那么数据节点个数应该为2、4、6、8...以此类推 专用主节点 [专用主节点分布] 为了提高集群的可靠性,用户在使用多可用区容灾功能时最少要创建三个专用主节点,且分布在三个不同的可用区中。
腾讯云数据库MySQL是一种高性能、高可靠、高安全、可灵活伸缩的数据库托管服务,其不仅经济实惠,而且提供备份回档、监控、快速扩容、数据传输等数据库运维全套解决方案,为您简化 IT 运维工作,让您能更加专注于业务发展。
扫码关注腾讯云开发者
领取腾讯云代金券