主备、冷备、热备、双活、多活、同城、异地、多云,等等等等,这些保证业务高可用和容灾名词,我们经常会听到,不绝于耳。 但是,真的当我们自己要去建设,选择方案时,就发现不知道该怎么选择和搭配了。...结合近期我们的一些讨论,准备用几篇文章简单分享下我们的理解,今天先聊冷备。 冷备是不是个好方案?...理论上,只要有状态的数据(也就是各类分布式服务,如数据库、缓存、消息等组件)同步好,接入层流量能够灵活调度,当出现问题的时候,切入口流量,就可以顺畅的切过去。...但是我们仍然要经过一些详细的论证,从其它角度看是否有解。 从另外一个角度的论证过程 当时我们讨论在冷备的前提下,应该怎么保证系统的可用性,没想到,论证的过程,反而进一步证实了冷备只是一个美好的愿望。...最后,结论 冷备只能是冷备,关键时刻并不能起到快速承载业务的效果,在业务容灾建设时,这个思路其实是不可行的。 但是对于部分组件,比如数据库、大数据、文件,这些存储类的部件,做冷备是有重大意义的。
每种灾备方式面向的管理目标不同,需要采用不同的方案满足需求。灾备数据库灾备是一项综合系统工程,灾备技术涉及到数据的复制、数据及应用的切换、数据的删除、数据的加密与传输、数据存储等多个技术的具体应用。...,要求相同的数据库版本,相同的操作系统平台,备库只能以只读模式打开逻辑卷效率较差一般不会做数据库容灾方案存储复制数据一致性高,效率好但是备库不可用,有可能把主库的磁盘坏块也复制过去IBM等存储厂商上述四种方式分别从应用底层到应用上层进行复制...,非核心业务,由于没有太大访问量,没必要花更多的成本去做容灾主从库的必要性读写分离是否有效降低主库负载总结功能&目标差异灾备数据库:主要用于在主数据库发生故障时,能够迅速接管业务,保证数据的可靠性和业务的连续性...灾备数据库通常与主数据库保持同步,以便在主数据库不可用时,能够无缝切换。...不管企业的业务环境有多复杂,灾备的核心就是解决数据同步和应用程序变更的多地发布的问题只读数据库:主要用于分担主数据库的读取压力,提高读写性能,增加应用的吞吐量。
一、引言数据库的高可用性与灾难恢复能力是衡量其可靠性的重要指标。在日益复杂的业务场景中,GBase 数据库通过独特的架构设计和灵活的容灾机制,为用户提供了稳定、快速的服务。...本文将围绕 GBase 数据库的高可用架构展开讨论,并结合实践案例和代码示例介绍如何实现可靠的灾备策略。二、高可用架构设计1....备份与恢复定期备份是数据库灾备的基本策略。GBase 提供了多种备份方式:• 逻辑备份:使用 mysqldump 工具导出数据。• 物理备份:复制数据文件或使用第三方工具。...conn.close() return resultresult = query_db("SELECT * FROM orders LIMIT 10;")print(result)五、总结GBase 数据库以其强大的高可用架构和灵活的容灾策略...从主从复制到异地容灾,从性能优化到快速故障切换,GBase 的每一项特性都为数据库运维提供了更多选择。
关于Data Guard在我原来印象中是有阴影的,起源是在OCM考试中,有很多同学在一个小时内搭建出Data Guard环境,但是做了主备切换,反复切换的时候出了问题。...其实在2017年的时候,就已经在规划一本新书是关于灾备,但是拖延症的我确实拖了太久,事情悬而未决,想起来就上火。...2.在11g开始,Data Guard已经不简单是一个备库的角色了,它开始承载很多更有实际价值的任务,比如批量查询任务,比如通过快照数据库来评估DML,DDL等,所以基于这个重大的变化和方向,我觉得对Data...3.从实际的使用来看,Data Guard出现问题的情况很多和官方文档的系统性差别很多,或者说官方文档是实用不实用的内容都有,需要甄别,比如备库有两种类型,几乎99%以上都是Physical Standby...所以这些算是我对于这个灾备书籍的一个入手点和出发点。至于稿酬,如果你认真了,开始你就输了。还有个不是理由的理由,那就是这算是自己规划的一个方向,这个任务解决了,自己就不用那么纠结了。
其中包含了一个用于传递来自乘客和司机 App 事件数据的发布/订阅消息总线、为流式分析平台(如 Apache Samza、Apache Flink)提供支持、将数据库变更日志流到下游订阅者,并将各种数据接收到...例如,图 3 显示了 Uber 的动态定价服务(即峰时定价)如何使用双活模式来构建灾备计划。价格是根据附近地区最近一系列打车数据来计算的。...主区域的更新服务将定价结果保存到双活数据库中,以便进行快速查询。 图 3:双活消费模式架构 当主区域发生灾难时,双活服务会将另一个区域作为主区域,峰时价格计算会转移到另一个区域。...同样,其余行记录了其他复制路线的检查点。 偏移量管理服务将这些检查点保存在双活数据库中,并用它们来计算给定的主备消费者的偏移量映射。同时,一个偏移量同步作业负责定期同步两个区域之间的偏移量。...图 6:主备消费者从一个区域失效转移到另一个区域 - 结论 - 在 Uber,业务的连续性取决于高效、不间断的跨服务数据流,Kafka 在公司的灾备计划中扮演着关键角色。
互联网常见的高可用手段。比如服务冗余部署、异步化设计、负载均衡、服务限流降级熔断、架构拆分、服务治理、分布式存储等等,今天主要是一起聊下,多机房部署的灾备架构模式,来确保服务的高可用。...::: hljs-center 常见的架构模式 ::: 灾备架构比较常见的几种模式,基本分为同城多中心、跨城多中心、跨国多中心。...它的一些关键特征是: (1)相同城市,距离在 50km 以上。为什么需要在 50km 以上呢?如果从机房的建设上讲,没有什么不可以,相距 5km 也可以建设。但我们做双机房,是为了高可用灾备或者备份。...复制代码 (4)异常处理 针对极端异常的情况,考虑如何处理,可以是技术手段,也可以是非技术手段。 复制代码 业务兼容 体验不好优于无法体验。比如数据短时间不一致,数据暂时无法获取。...为了灾备,用户维度的数据,单元机房和中心机房之间会双向同步。 数据架构示意图 数据同步 按照业务的拆分规则,单元模式的数据,不同的用户会在不同的单元进行写入。单元和中心之间会双向同步。
所谓好的用户体验 由 Ghostzhang 发表于 2012-07-16 19:20 怎样的用户体验才是好的用户体验呢?...好像有点跑题了,这次的思考是:并不是所有关注用户感受的体验就叫做是“好”的用户体验。 从何而来这想法呢?...上面的唠叨是一个引子,结果就是"不能赚钱的交互不是好交互",简单的说就是好的交互可以赚钱,可是不好的用户体验也是能赚钱的。...但是从商家的角度来说,我们需要考虑几个因素,第一个就是成本,这个是直接决定了能给用户提供最佳体验的上限到哪,好的椅子意味着更高的成本;其次是投入产出比,开门做生意,不为赚钱是很少的,投入越多,意味着盈利周期可能越长...麦当劳的椅子虽然用户体验不是最好的,但却是这么多年来产品与体验最好的平衡,从而实现利润的最大化。 当你再次遇到这种问题时,就知道如何处之泰然了。(本届 年会 的主题)
提出论点 好的研究想法,兼顾摘果子和啃骨头。...两年前,曾看过刘知远老师的一篇文章《好的研究想法从哪里来》,直到现在印象依然很深刻,文中分析了摘低垂果实容易,但也容易撞车,啃骨头难,但也可能是个不错的选择。...学生年代,作为老师的一个不成器弟子,学术上没有什么建树,幸运的毕了业。现如今到了工业界摸爬滚打,虽然换了个环境,但是发现生存的道理没变。 反面例子 不好的工作想法会加剧“卷”的用户体验。...这样的工作体验确实很糟糕。 我的触发点 沿着你造梦的方向先动手干起来。一年前刚开始决定做攻击者画像的时候,其实心里有底也没底。...引用 好的研究想法从哪里来 杜跃进:数据安全治理的基本思路 来都来了。
通常金融、医疗等行业的大型企业,可以建设传统灾备中心来保障核心业务的安全,但是每年在灾备上的花费都是一笔不小的数目。...碍于传统灾备中心建设成本高的问题,很大一部分中小型企业无法建立自己的灾备中心,未能实现有效的灾备方案。...让云容灾成为一种普惠型的灾备服务,中小型企业也可以享受到灾备服务,让大型企业可以摆脱传统灾备的高成本负担。...3.用HyperBDR云容灾低成本构建腾讯云灾备方案 为了满足中小型企业的灾备需求、节省大型企业的灾备成本,我们可以选择在国内的主流云商腾讯云上构建灾备方案。...不再需要1:1准备计算资源也能云商恢复,这让企业可以以备份的成本享受到容灾体验。 平时更多用到的是容灾演练。
题目部分 基于数据库的数据复制技术构建灾备方案有哪些? 答案部分 基于数据库的数据复制技术大体上可分为两类:数据库自己提供的数据容灾模块和第三方厂商提供的数据库复制技术。...与最大保护模式一样,日志数据需同时写到源数据库的联机日志文件和至少一个备库的备用日志文件(standby redo log),事务才能提交,与最大保护模式不同的是,如果主库日志数据不能写到至少一个备库的备用日志文件...所有复制对象结构(DDL)的改变,都必须通过Oracle提供的复制包来实施 基于日志挖掘 主要用途 灾备恢复、高可用性 数据共享 数据同步 高可用与容灾、实时数据集成 实现简易程度 实现过程和管理简单...经过对以上几种数据库复制技术的分析,DataGuard、Stream、Advenced Replication是专为Oracle数据库开发的灾备模块,适合于同构平台的Oracle数据库容灾;Shareplex...适合于异构平台的Oracle数据库容灾;GoldenGate适合于异构平台和异构数据库的容灾与应急备份,消除计划内停机、双业务中心、数据仓库实时供给、实时报表等应用场景需求。
但备份只能保护数据的安全性,并不能在系统宕机时,做到业务的快速接管。对大部分企业来说,备份是可以满足基本的灾备需求了。...二、云容灾如何助力中小型企业云容灾是通过在云上建立灾备中心,利用云原生的天然优势,实现更低成本更高业务连续性的灾备方案。让中小型企业也可以低成本容灾,摆脱业务停机、病毒勒索的风险。...不同于传统的灾备方式,需要建立相同的一套架构来对应生产中心可能的故障失效,可能要花费数月甚至数年的建设时间。...这种按需弹性付费的特点,大幅度降低了容灾资源的成本。传统运维业务系统复杂,需要大量的专业运维人员。而云上资源的可编排性以及自助化的容灾使用体验,降低了对人员技术能力要求,直接降低了运维的复杂度。...不再需要1:1准备计算资源也能云商恢复,这让企业可以以备份的成本享受到容灾体验。平时更多用到的是容灾演练。
故事背景 就在昨天,腾讯云部分功能挂了,经查实广州机房的光缆被挖断导致。当时也影响到了我们视频云转拉这边的业务。有个例子是,一个小客户有个流没有拉起,但是收到了已经拉起的回包。...经过我们的分析,原因如下:当转拉请求下发到服务器(内网之间的通信,使用的是内网IP),服务器能收到并处理该请求,所以正常回包。...当请求处理程序启动ffmpeg进程时,ffmpeg会去和源站建连(使用外网IP),由于光缆断了,外网肯定是不通的,转拉自然也不会成功。正因此也引发了我们关于转拉灾备的一个思考。...统计该ip下正常的ffmpeg进程和异常的进程(对于网络这个问题,异常就是ffmpeg报建立连接失败错误)的次数。...像腾讯,阿里这样中国互联网超一流的公司,也偶尔会遇到因为容灾问题而导致的服务不可用问题。
由于 activemq 承担着消息服务的重要角色,在这篇文章中我们重点讲述在灾备双活建设中 activemq 设计、规划、部署。...随着各个行业对 IT 灾备建设的重视,越来越多的企业、单位正在筹备、实施 IT 灾备建设。由于早期的建设并没有充分考虑多数据中心下容灾方案,势必在新的多数据中心环境需要做一番整体架构的调整、重建。...本文是对目前业界流行的消费服务产品 active 在灾备双活建设的一些探讨,希望起到抛砖引玉的效果。...目标 灾备双活建设最完美的架构设计:在同城、异地 2 个数据中心,在最极端情况下,例如单数据中心垮掉情况下,保证消息零丢失,支持 7*24 服务要求。...演讲议题涵盖 Oracle 18c 的新特性解析和 DBA 的未来、 Oracle 数据库故障诊断、金融行业 PaaS 云数据库平台解决方案等。欢迎各位数据库爱好者报名参与! ?
其中包含了一个用于传递来自乘客和司机 App 事件数据的发布 / 订阅消息总线、为流式分析平台(如 Apache Samza、Apache Flink)提供支持、将数据库变更日志流到下游订阅者,并将各种数据接收到...例如,图 3 显示了 Uber 的动态定价服务 (即峰时定价) 如何使用双活模式来构建灾备计划。价格是根据附近地区最近一系列打车数据来计算的。...主区域的更新服务将定价结果保存到双活数据库中,以便进行快速查询。 图 3:双活消费模式架构 新年新气象,该换一波壁纸了!...同样,其余行记录了其他复制路线的检查点。 偏移量管理服务将这些检查点保存在双活数据库中,并用它们来计算给定的主备消费者的偏移量映射。同时,一个偏移量同步作业负责定期同步两个区域之间的偏移量。...结论 在 Uber,业务的连续性取决于高效、不间断的跨服务数据流,Kafka 在公司的灾备计划中扮演着关键角色。
今天分享一些关于灾备的概念与实践,希望大家有收获。 - 为什么要做灾备? - 当时开始要做灾备的原因,是因为有一次机房A故障了,大部分的服务都不可以用:时长上涨、接口失败。...知道问题的根本原因后,解决问题的核心方向就是解决单点问题,解决单点问题的方案有:服务冗余(多一份可用的服务),做灾备。 - 什么是灾备? - 灾备,简单点说,就是生产环境上部署的服务。...,这样既不会使得整个接口失败导致无法进行后续的操作,也不会影响用户体验。...这样一来,接口 A 并不知道B服务失败,用户侧体验是一直等待,然后显示失败。理想的做法是希望能在 B-C 网络不通的情况下将后续到来的流量拒绝掉,快速响应失败的结果。...所以,做灾备是不能脱离业务的,应该给业务开发拿出相应的时间完成服务灾备,提高服务稳定性。这对业务而言,出现故障时不影响用户的使用,用户无感知,就是提高用户的体验。
这是因为容灾系统往往都很复杂: 每个企业的灾备环境不同:冷备容灾、同城双活、异地双活、两地三中心等等,每种灾备架构使用的产品、技术、切换过程可能都各不相同; 涉及的产品和技术多且复杂:web访问切换、应用切换...VRP 通过的VOM 对受控端的应用进行统一的灾备切换管理。...接下来我们就可以定义具体的灾备切换预案了。预案是一个任务模板,这个任务可能包含了单个应用、某几个应用或者一大批应用的整体切换执行。按照实际切换需求定义具体的灾备切换预案。...为响应银保监会严格的监管要求,赣州银行建立了完备的两地三中心灾备体系,并且每年都会进行真实的灾备切换演练。叶光芳是赣州银行系统数据库团队负责人,每年,他都要参与灾备切换演练。...跨应用的灾备切换,复杂程度非常高。嘉为蓝鲸容灾切换管理系统,能够快速编排出整体的灾备切换方案,并一键自动化的执行所有操作。
题目部分 基于主机数据复制技术的灾备方案有哪些? 答案部分 采用基于主机复制技术的容灾方案的示意图如下: ? 图1-1....基于主机的容灾方案示意图 采用基于主机系统的数据复制技术的核心是利用主、备中心主机系统通过IP网络建立数据传输通道,通过主机数据管理软件实现数据的远程复制,当主数据中心的数据遭到破坏时,可以随时从备份中心恢复应用或从备份中心恢复数据...采用基于主机的数据复制技术建设容灾方案有以下优点: Ø 基于主机的方案最主要的优点是只和服务器平台和主机数据管理软件相关,完全不依赖于底层存储平台,生产中心和灾备中心可以采用不同的存储平台; Ø 可同时对数据库和文件系统提供容灾保护...; Ø 灾备中心的数据一般不可用,如果用户需要在远程数据中心使用生产数据进行开发测试、DW/BI应用使用将非常困难; Ø 利用主机数据复制软件的方案比较复杂,尤其是和数据库应用结合的时候需要很复杂的机制或多种软件的结合...此类容灾产品,相应的容灾网络建设成本相对较低。 适用场景: 目前,企业采用基于主机的数据复制技术建设容灾方案的案例相对比较少,通常适合单一应用或系统在I/O规模不大的情况下局部使用。
发现问题 前期做规范的过程是十分痛苦的,每做一个板块都要花很多时间去思考怎么表达、展示才能让其他设计师和程序员都一目了,然而随着内容的增加,发现很多地方无法深入的执行下去,只能含糊其辞,给我们制作规范的人员带来了很大苦恼...为什么有如此大的执行阻碍呢?带着问题我们找到团队的一位设计前辈请教了一番,在前辈的指点下,终于发现了问题所在:我们对于前端如何实现设计稿其实并没有很好的了解。...图1-1是XX项目的所有关于二级导航的样式,因为这一块的界面不是我做的(都是借口),所以规范不太了解,导致在做整个项目的规范时,遇到了极大的阻碍。...而第一个容器内的绿色和蓝色部分(间距)也是固定的,所以只有红色区域是可变化的,因为红色区域的文字个数是可以变化的,我们只要给出字体大小即可。...任何事情都有其内在的套路与规律,我们必须要了解事物的本质,才能帮助我们更好的执行;所有的苦恼与迷茫都是源自你对事物的理解不够透彻,所以让我们从现在开始,锻炼透过事物看本质的思维能力,就算以后你不做设计了
本文组织: 灾备系统建设任重道远 CDM简介 南京政务云CDM灾备方案分析 1 灾备系统建设任重道远 灾备系统建设是IT领域永恒的话题,但是,目前很多企业仍未重视灾备建设的重要性。...相比传统架构下的灾备系统,云基础架构之上的灾备系统建设带来的新挑战主要是针对虚拟机环境的特殊性做一系列适配,以及与云管理平台的集成统一管理。 ?...Copy Data Management(CDM)是灾备领域近年来出现的新概念,本文利用一个案例向大家展示CDM如何在私有云中落地实现云虚拟化环境的灾备。...可以结合数据库的连续日志,在虚拟全备的基础上进一步降低RPO。...主服务器对所有代理端、存储服务器的数据进行管理; 用户通过WEB管理界面,在主服务器上配置好作业信息,主服务器将作业指令下发到代理端。
我主要负责介绍了VMware灾备与双活方案。很多同学表示出来了较大的兴趣,因此写出来共享给大家,由于内容较多,本次先发布灾备部分内容。 一.灾备 谈到灾备,首先谈到灾害。...当一个站点发生故障时,SRM会自动将故障站点的虚拟机在灾备站点重启,实现灾备切换。虚拟机切切换到灾备站点,IP地址可以不变或者改变,站点切换时还可以定义虚拟机切换的优先级。...6.灾备切换开始,过一会,虚拟会在灾备站点重启。 ?...(4)当海啸在数据中心1所在地发生之前,客户数据中心1的业务都已经切换数据中心2,也就是灾备中心。成功避免了由于灾害影响到业务。 ?...接下来请欣赏-VMware的灾备与双活----我在vForum 2015分会场的分享(2)--双活篇。
领取专属 10元无门槛券
手把手带您无忧上云