展开

关键词

端虚拟机遭遇的重重挑战

使用裸机恢复(BMR)技术,将内部物理端物理器在技术上可行的,但是这不实际。很少有灾难恢复厂商支持这么做,因为它们基于虚拟器技术。 如果你有必要的带宽,将器映像备份到端相当简单。但是在场景下在端运行那些应用程序却完全不同。 要弄明白公有提供商和灾难恢复厂商如何保护你,远离其他租户及的影响。 另一个潜在问题出现在自动化上。 因为值得一做 你做好了设置和级别后,虚拟端是一种出色的灾难恢复方案。 端虚拟化还能帮助裸机恢复。裸机恢复是指万一出现,恢复一个相同的这个过程,从操作、驱动程序、应用程序一直到生产数据。物理裸机恢复需要相同的硬件环境,确保无差错恢复,不然你会遇到严重错误。

53580

历时三年,苏宁如何建设多数据中心多活的实践项目?

Region:地理区域,有多可用区所组成的集合,区域之间域完全隔离。 1、主备模式 ? 主机房提供,备用机房不提供,当主机房到备用机房接管。 2、同城双活 ? (2)多数据中心间高可用 单同城高可用:任何一个有计划维修或非计划性,都可到另外一个数据中心 全链路同城高可用:当机房级别或维修时,可到另外一个机房接管。 进行单流量划拨,确保每个的正确性。 全链路流量划拨,确保端到端的正确性。 3、全链路监控 ? 为了模拟机房,通过混沌工程逐步提高爆炸半径,模拟业,减少对业的影响,主要模拟如下: 单模拟:比如订单或会员单个 全链路模拟:比如交易链路或支付链路多个同时 网络模拟:比如交机或路由器等 整个机房级别模拟:比如电源(市电、UPS 等)导致整个机房 通过混沌工程模拟可以相对真实验证整个多活的容灾能力,整个模拟对业的影响都相对可控,

53831
  • 广告
    关闭

    腾讯云精选爆品盛惠抢购

    腾讯云精选爆款云服务器限时体验20元起,云数据库19.9元/年起,还有更多热门云产品满足您的上云需求

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    电子政应急预案

    2.2 触发条件出现以下情况则触发应急预案:一级平台发生导致业中断、数据丢失。一级包括以下内容:平台发生导致业中断、数据丢失。 平台与电子政网之间的网络出现中断。某个面向公众的业出现业中断或数据丢失。 二级包括以下内容:平台出现,但不影响业运行,不影响业数据。某个面向部分用户的业在业高峰期出现业中断。某个面向单位内部的出现业中断。 3) 入侵检测电子政平台核心交机旁挂锐捷的入侵检测,对数据中心各区之间和各用户访问数据中心的流量进行对应的安全防护。 5) 漏洞扫描在电子政平台内部的汇聚层交机上旁挂启明星辰天镜脆弱性扫描与管理对整个平台内部的器进行漏洞扫描。

    1.3K21

    原生环境下对“多活”架构的思考

    特别当 B 站后,各路文章出来解读多活,如何实施多活(很多的文章当个乐子看即可)。像这种比较基础的,往往恢复时间都是不确定的,多活确实是解决问题的有效手段,能大大提高我们的容灾能力。 多多活的技术细节 多多活指的是公司选择两家商,将部署两个上,正常情况两个同时对外提供,当其中一个出现问题时,将流量全都到另外一个。 这个架构的大概流程: 客户端通过接入层访问相关 接入层根据流量分发规则,将流量向下分发到业层 业层经过相关的业逻辑处理,将相关数据写入到相关的存储中 流量分发/ 分布在不同的两个的集群的承载能力是需要经过评估的 不过一般情况下,两个会尽量保证的承载能力是一致的,所以流量是平分到两个集群中。 当某个发生的时候,在流量接入层会将流量全部到另外一个上,保证另外一个不会用户造成影响。 因为当主节点所在的出现时,在流量接入层可以将流量到另外一个集群,但是我们的主业肯定不是”只读“的,肯定还有写业存在, 于是出现的时候,只能看到一堆堆的写失败报警,有些业接口肯定也在报错

    22430

    秒级容灾,UCloud内网高可用之三代架构演进

    下面,本文将对UCloud秒级的内网高可用进行详细介绍。 ? 基于内网VIP的高可用 1、高可用的理念和要点 从业角度看,当然要尽可能避免应用出现。但要完全不出是不可能的。 当任一节点发生时,业自动至正常节点,且整个过程用户均无感知,这就是高可用的基本理念。而实现高可用的两个要点是备份节点和自动转移。 ? 作为用户自定义高可用的可漂移内网入口,从发现到自动完成,无需额外的API调用和机器内部配置,即可完成秒级。 ? 图:内网VIP控制台操作界面 ? 在不考虑外部依赖突发的前提下,如网络问题、第三方支付和银行的大面积不可用等情况,该电商希望通过提高自身支付的高可靠能力来保证消费者的可用性体验。 为了实现高可用,UCloud基于Keepalived+内网VIP产品为该电商线上支付快速构建了高可靠,从而避免自身单点,大大提高的可用性。 ?

    37330

    定时任调度框架 Quartz 之

    [源码分析] 定时任调度框架 Quartz 之 目录 [源码分析] 定时任调度框架 Quartz 之 0x00 摘要 0x01 基础概念 1.1 分布式 1.1.1 功能方面 1.1.2 0x02 Quartz在集群模式下通过和任负载均衡来实现任的高可用(HA High Available)和伸缩性。 的发生是在当一个节点正在执行一个或者多个任失败的时候。当一个节点失败了,其他的节点会检测到并且标 识在失败节点上正在进行的数据库中的任。 当其中一个节点在执行一个或多个作业期间失败时发生(Fail Over)。当节点出现时,其他节点会检测到该状况并识别数据库中在节点内正在进行的作业。 如果存在节点,则更新节点的触发器状态,并删除节点实例状态。这样集群节点间共享触发任数据就可以进行,并信号通知调度线程。节点的任的调度就交由调度处理线程处理了。

    25440

    【玩转腾讯】如何构建端高可用架构!

    正交分解如下: 分类 治理        目标 技术     架构 监控层 外层 客户端SLA、攻防/扫描/审计  CDN合理/稳定、DNS合理/稳定流量峰值 CDN  DNSPOD/Ip直连高防 外层CDN高可用性  自建CDN 质量监控,调度,自动; 腾讯CDN 本身具有高可用监控,节点快速剔除节点; HttpDns:客户通过嵌入SDK, 不经过传 DNS 解析方式来使用 CDN 跨可用区灾备,出现秒级; 容器etcd多台器跨机房容灾; 下环境做测试和备份; 充分利用腾讯CLB、容器、CDB等跨可用区特性,构建高可用容灾; ? 层高可用思路  的整体概览 无状态 拆分子 通信协议和交互接口 同步/异步 超时管理,自动熔断, 快速,慢隔离 独立扩展,快速扩容 单元条带化 ?   CBD高可用  一:数据库节点异常 只读从库、灾备实例数据正常; 后台隐藏实例可快速恢复业; 后续动作需要后台新建隐藏从库实例; 二:可用区异常 主库及只读从库无法访问; 手动灾备实例为主实例

    51340

    TDSQL战绩 | 微众银行断电演练,秒级零感知

    这是一场模拟单个数据中心完全不可用的灾难恢复演练,通过模拟城市级灾难事断其中一个IDC中心来检验提升恢复、数据安全保能力而进行的运维活动。 为了模拟单个中心的场景,运维人员关闭一个数据中心的所有内外网出口,用户流量立刻自动到正常的数据中心,全行所有业和渠道正常提供,真正做到用户“零感知”。 同时,各业产品稳定运行24小时后,用户流量顺利回,模拟的数据中心重新投入运行,全程业无感知,这证明了银行核心架构真正实现了“多中心多活”。 ? 微众银行演练现场 这个过程中,金融级分布式数据库TDSQL的高可用能力是的“保护罩”,基于其自主研发的秒级自动、强同步复制技术,确保了客户数据能实现跨机架、跨 IDC 、跨城的自动化容灾和数据一致性 在自动化容灾监测、秒级等能力保下,金融核心可实现99.999%的金融级别高可用,且灾难恢复后数据零丢失、业零中断。

    16940

    腾讯高可用和容灾解决方案

    实现业连续性所需的 IT 措施包含三个方面:业状态数据的备份和复制、业处理能力的冗余和、外部接口冗余和。 一般说,高可用技术通过对网卡、 CPU、内存、软件设置不同的可用性监测点,在这些节点发生时实现冗余,持续提供。 从角度, HA 主要处理单组件的导致负载在集群内的器之间的, DR 则是应对大规模的导致负载在数据中心之间做。 7.png 如上图所示,在负载均衡实例下绑定不同可用区的 CVM,当广州三区发生时,广州四区的器仍可正常提供,这样即可以避免因为单个可用区的而导致对外的不可用。 负载均衡CLB产品本身没有提供这样的能力,跨地域容灾的能力是通过解析DNS+DNSPod产品来实现的,解析DNS产品提供了解析的能力,DNSPod提供容灾的能力,网站宕机后自动DNS记录,多种算法

    7.6K265

    centos7中systemctl和资源限制

    我们的器中使用了很多启动脚本为shell脚本,为了方便管理改为systemctl方式管理。 早上重启后正常,但是晚上流量高峰期间,大量用户无法链接器。 查看器进程日志出现大量报警日志。 后经过大佬排查。发现是因为systemctl启动的进程没有遵循limits资源限制,导致到达systemctl默认限定值后无法加载更多文件!

    22530

    微信支付:如何打造移动支付时代的高可用收银

    微信等)部署在一起,相互影响; 业逻辑和数据部署在一起,相互影响; 无异地容灾、自动能力; 3.数据容灾恢复不及时: DB单点、主备依赖人工、恢复时间(TTR)不可控; 为了帮助商户提升质量 针对这个问题,一些商支持“BGP网络访问跨地域实时”的能力,通过冗余网络出口部署,实现跨区域网络间灵活调度,为网络出口灾备提供了保。 腾讯的负载均衡具备健康检查能力,可允许用户自定义健康检查频率,以确保后端器在出现时第一时间感知到并且及时走业流量,保证前端应用的高可用和无感知。 MySQL容灾策略普遍依赖“半同步,主备”,通过自动或者人工(业恢复时间在1分钟到几十分钟之间)。这对于交易量稍大的场景来讲,恢复时间还是太长。 某组DB发生时,订单查询和撤销等操作需等主备恢复才能进行。 这里的注意事项: 计数器需要设置周期,比如一分钟,以便设备恢复自动启用。

    1.7K00

    YH5:Extended RAC 双活解决方案

    题记:对于企业关键业而言,信息可靠性是关键。各行业关键 IT因为导致中断的事件仍然时有发生,近年来有一些银行 IT ,虽然建有两地三中心布局,但仍然有业中断的现象。 近年来,互联网企业计算、大数据风起涌,传企业在市场压力下,也面临着利用新技术,更好的用户与市场的迫要求。 1、在某移动集团公司,针对传容灾慢、接口难同步等问题,我们提出了Extended RAC方案:新业改造上线与 ORACLE 远程 RAC 双活一起建设,既可解决容灾建设时间不足,也可解决传方案容灾 2、某保险公司,因为对业稳定性与连续可用性极高的要求,迫需要能够从主机、存储、网络、运行环境等各个层级防止单点,提高业连续性的高可用容灾解决方案,确保整个IT业实现7×24的业连续运行 若共享存储出现,则会导致集群内的所有节点的,因此需要开发新的模式来提高的性能更好地保证数据的安全。

    1.1K40

    想了解数据库安全?看这一篇文章就够了!

    对于自然灾害和IDC这类“天灾”,TencentDB提供了灾备实例/多可用区、数据传输DTS、秒级帮助用户以较低的成本提升业连续的能力,同时提升数据的可靠性,避免单地IDC导致业完全瘫痪 灾备实例/多可用区 针对业连续和数据可靠性有强需求或是监管需要的场景,TencentDB提供灾备实例/多可用区,可提供跨地域灾备(提供实时备份,秒级等)。 秒级 TencentDB会自动处理转移,可以快速恢复数据库操作而无需管理干预。出现可用区中断、主数据库实例任一条件,主数据库实例会自动到备用副本。 从外部防护、数据安全传输,以及人为的监控和恢复方面,为您的数据库提供完善的安全防护和高效的恢复,全链路提高数据资产安全。 腾讯数据库将在2019年推出的Cloud DBA——一款数据库智能管家产品,可以为腾讯上的数据库提供健康巡检、定位分析、SQL上线审核等一,为您的数据库保驾护航,敬请期待!

    96750

    CODING DevOps 高可用实践,保稳定的“定海神针”

    除生产环境之外,CODING 还进行了备用环境的部署,如果发生发布事,可迅速至备用环境,保可用,在生产环境变更验收通过后,才会更新备用环境。 比如 CVM 在某个地域无法创建构建机器时,会导致使用该地资源节点的用户无法顺利构建,为了防范这个问题, CODING 持续集成采用灵活的容灾策略,对构建节点池进行地域,对进行转移,确保构建的稳定性 为及时应对,CODING 基于 Prometheus 构建了监控预警,用户可依据不同的业场景,通过运维方自定义监控数据的可视化和报警规则。 为提升整体稳定性以及各类异常的容错能力,CODING 还制定了演习标准定期演习,对于影响全站访问的核心业须保证每月进行至少一次演习,其它业最长演习间隔不得超过两个月,出现演习结果不符合预期时 在容错机制上 CODING 也进行了明确要求,如内部单点,下游都需具备自动发现和屏蔽错误的能力;不能存在超时或者无限重试导致雪崩的情况;在异常时,业需要有自动降级的方案。

    14220

    CODING DevOps 高可用实践,保稳定的“定海神针”

    除生产环境之外,CODING 还进行了备用环境的部署,如果发生发布事,可迅速至备用环境,保可用,在生产环境变更验收通过后,才会更新备用环境。 比如 CVM 在某个地域无法创建构建机器时,会导致使用该地资源节点的用户无法顺利构建,为了防范这个问题, CODING 持续集成采用灵活的容灾策略,对构建节点池进行地域,对进行转移,确保构建的稳定性 为及时应对,CODING 基于 Prometheus 构建了监控预警,用户可依据不同的业场景,通过运维方自定义监控数据的可视化和报警规则。 为提升整体稳定性以及各类异常的容错能力,CODING 还制定了演习标准定期演习,对于影响全站访问的核心业须保证每月进行至少一次演习,其它业最长演习间隔不得超过两个月,出现演习结果不符合预期时 在容错机制上 CODING 也进行了明确要求,如内部单点,下游都需具备自动发现和屏蔽错误的能力;不能存在超时或者无限重试导致雪崩的情况;在异常时,业需要有自动降级的方案。

    12240

    基于MySQL的分布式数据库TDSQL十年锻造经验分享

    上面的两个模块组成调度,暂时是用ZooKeeper来做元数据管理。第三模块是接入计算层,当发生时主备和对路由的更新都在网关层面上做。 上面的调度还包括负责监测的操作,以及分布式场景下的扩缩容任管理等,此外包括一些复杂SQL的重新以及计算工作。这是大体的核心架构。 在检测这个点上,目前来看很难有一的一个理论说怎么发现、怎么去,这是非常难的事情,更多还是经验方面的积累,我们秉承的原则还是:后,如果可用性能提升,才,否则免。 如果有时候出了问题可能会引发连续的,连续也没什么好处,比如说我们了一次后,配置在未来的一段时间不会做,用这样的逻辑做判断。 ? 这里是我们在恢复阶段的示例演示。 一旦因为,导致主备发生,除非再次发生,我们不会主动回来,这是同城三中心高度对等架构的好处。

    55730

    中间件PaaS层组件容灾方案及实践

    高可用、可扩展、容灾能力决定企业的连续性,中间件作为构建企业核心的重要组成部分,其高可用容灾能力也将决定应用的。 当4、6区任意一个可用区出现: 触发Ckafka实例各分区leader,实现所有leader分区从节点转移到正常可用区。 客户端消息读写请求路由到某一地域的主实例上,当主实例出现异常的时候,客户端的请求将被到另外一个地域 的集群上,确保客户端能够继续正常使用。 客户侧可以以每个Ckafka实例为单位,通过DNS将 所有流量到备区。 之后可以继续进行消息无缝生产/消费。 如果一个可用区内的单机,那么就会由没有的节点提供。这样整个集群依然能够对外提供,对客户侧的影响是有限的,客户端做好重试即可。

    1.7K6011

    解密Midas、Webank、金融背后的核心数据库TDSQL【海量之道2.0】

    ,实现数据访问、主备的一致性,确保在单机、单IDC时数据零丢失; •引入集群机制,实现自动的容量伸缩,确保在业飙升时,数据库能力自动适配业增长,保持对外的持续可用。 以两台器为例,如果它们在同一个机架、或者接入同一个交机、或者在同一个IDC,当机架电源、或者接入交、或者IDC,则两台器对外将表现为同时。 当一个SET中主机时,自动至备机,对上层应用没有任何影响;由于节点间的数据副本是强同步的,数据也不会有任何的丢失或错乱。 Watcher节点不参与主备选举,仅通过异步方式从master复制数据。当整个主城且无法短时间内恢复时,可以直接将到异地的TDSQL上。 任意时候,如果主节点,只需要将请求路由到数据最新的备节点即可,对外不会中断,数据也不会丢失。

    58990

    腾讯原生数据库 TDSQL-C异地容灾核心能力构建

    IO的。 ; TDSQL-C异地容灾的实践 (TDSQL-C多维一体的容灾原生数据库TDSQL-C在异地容灾能力构建上,近期推出了跨可用实例功能,支持跨AZ的手工和自动。 ● 通过心跳上报给Scheduler,Scheduler根据实例状态做出不同的决策,确定是否需要发起,以及是可用区内的还是跨可用区的步骤: 1. 当主可用区发生,ZK自动,Scheduler通过ZK重新选主; 2. 等待Agent租约超时后,Scheduler发起; 跨AZ的挑战: 主要有两点,防双写和防误。防双写是为了避免可用区后,原可用区仍然可读写,造成数据混乱。

    14730

    腾讯原生数据库 TDSQL-C异地容灾核心能力构建

    原生数据库TDSQL-C作为腾讯架构平台部核心数据库产品之一,致力于为上ToB用户和公司自研业提供集高性能、低成本、大存储、低延迟、秒级扩缩容、极速回档、Serverless化七大特性于一体的企业级数据库 IO的。 ● 通过心跳上报给Scheduler,Scheduler根据实例状态做出不同的决策,确定是否需要发起,以及是可用区内的还是跨可用区的步骤: 1. 当主可用区发生,ZK自动,Scheduler通过ZK重新选主; 2. 等待Agent租约超时后,Scheduler发起; 跨AZ的挑战: 主要有两点,防双写和防误。防双写是为了避免可用区后,原可用区仍然可读写,造成数据混乱。

    8110

    相关产品

    • 云数据库 Redis

      云数据库 Redis

      云数据库 Redis,数据库缓存,数据库存储,云数据库 云数据库 Redis(TencentDB for Redis)是腾讯云打造的兼容 Redis 协议的缓存和存储服务。丰富的数据结构能帮助您完成不同类型的业务场景开发。支持主从热备,提供自动容灾切换、数据备份、故障迁移、实例监控、在线扩容、数据回档等全套的数据库服务。 云数据库Redis是腾讯云打造的兼容 Redis 协议的缓存和存储服务。丰富的数据结构能帮助您完成不同类型的业务场景开发。支持主从热备,提供自动容灾切换、数据备份、故障迁移、实例监控、在线扩容、数据回档等全套的数据库服务。

    相关资讯

    热门标签

    扫码关注云+社区

    领取腾讯云代金券