首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

架构分析和选择策略

1.传统中心架构 半径是衡量方案所能承受灾难影响范围指标。不同灾难影响范围是不同,而距离也会影响到技术选择。...中心架构按照源备端之间距离,可分为本地、同城双活、两地三中心。 1.1本地 本地一般指主机集群,当某台主机出现故障,不能正常工作时,其他主机可以替代该主机,继续正常对外提供服务。...在数据级方式下,所建立异地备中心可以简单地把它理解成一个远程数据备份中心。数据级恢复时间比较长,但是相比其他级别来讲它费用比较低,而且构建实施也相对简单。...2.3业务级 业务级是全业务,除了必要IT相关技术,还要求具备全部基础设施。...4.云级别和能力 参考传统级别划分,由于云基础设施采用了云平台,在云级别划分上,应用级和业务级区别已经不大了,因此在这里将云级别分为:数据级、业务级

2.4K30

客户案例—zookeeper迁移方案

3台不停止服务最低限度是2台(X/2+1),而5台最低限度是3台。 我们应该保证,集群中最低有3台ZooKeeper是启动。...此外,重启时应保证先重启myid最小机器,由小向大进行重启 Leader无论其myid大小,都放到最后重启 因为ZooKeeper机制中,myid大会向小发起连接,而小不会向大发起连接。.../conf/zoo.cfgMode: follower 将其扩容为5节点ZooKeeper 先查看原先ZooKeeper集群情况 echo mntr|nc localhost 2181 这条4字命令可以查看集群情况...STOPPED 查看新Leader ZooKeeper会尽可能选择myid最大机器为Leader,因此原本idc02-kafka-ds-04其myid为5变为了Leader 12345 [hadoop...然后只要将现在5台再缩小到3台且不包括原本myid为1-2机器,就完成了迁移 将5台缩小回3台 修改idc02-kafka-ds-02 根据前面的注意事项,我们此时5台集群中启动数量不得少于3台,

1.6K51
您找到你想要的搜索结果了吗?
是的
没有找到

系列(六)——数据存储建设

数据存储建设主要从数据可靠性和业务稳定性两个维度阐述。这两者有哪些区别呢?...1.数据可靠性 1.1 云硬盘(CBS) 云硬盘采用三副本分布式机制,系统确认数据在三个副本中都完成写入后才会返回写入成功响应。...LIST parts接口查询uploadID所有已完成分块,然后筛选出未完成分块,来单独上传来进一步节约时间,提升效能。...场景三:存储设备故障时间较长业务自愈能力建设 如果存储集群或者访问链路出现秒级抖动,采用客户端或者应用重试方式是可行。...这里最常用就是新增COS和CBS盘方式让业务进行临时写入,待故障恢复后,补齐数据。

3.3K73

系列(八)——同城数据冷备建设

为了让企业能更好用好云平台数据安全能力,本文重点云平台数据备份冷备能力,以腾讯云为例,主要从以下两个维度介绍:同城数据冷备能解决企业什么问题,达到怎么样业务效果?...数据冷备介绍1.1 数据冷备概念数据冷备,业务数据文件在同地域或者跨地域定时做备份。数据不是实时备份,数据恢复存在不完整性,同时业务恢复无法自动切换,需要人工介入,数据冷备RPO和RTO为小时级。...如果企业有业务切回需求,主要依赖于dts数据同步工具,当追平数据后,在业务低峰期将业务切回之前可用区。3....本文小结同城冷备方案,在云平台协助下,企业几乎0成本并拥有同城数据冷备能力来保障业务生命线。指标详细说明能力具备同地域(不同可用区)数据备份能力,不具备不同地域能力。...3.演练能力建设,增加平时运维成本以及自动化工具开发功能。

6.5K113

系列(九)——异地数据冷备建设

企业业务部署在云上,借助云平台能力,企业几乎“零”成本拥有同地域数据备份能力。...目前云函数支持备份产品如下:图片跨地域复制:目前云函数只支持同地域备份,即备份数据库和cos需要同地域,因此通过存储桶跨地域复制能力,将对应备份文件复制到异地存储桶。...2.3 数据库备份服务数据库备份服务拥有一套完整数据备份和数据恢复解决方案,具备实时增量备份以及快速数据恢复能力,同时具备异地能力。...以mysql为例说明,主要步骤如下:1)购买数据库备份服务,这里注意选择备份地,例如业务在广州,备份在北京,备份地选择北京;根据数据量大小选择对应规格。...如果企业有业务切回需求,数据库依赖于dts数据同步工具,cos通过日志进行人工补录,待两端数据一致后,在业务低峰期将业务切回之前地域。

8.7K164

系列(三)——云网络建设

IDC时代,业务对网络参与较少,主要依赖数据中心网络建设程度;当到了云时代,云服务商将底层网络能力产品化后,云上客户更多参与网络建设,提升业务稳定性。...以腾讯云为例,在同地域选择机房地址时候,距离大于60公里,要求不同可用区延时小于3ms,来满足云上客户同城建设基本需求。...2.网络复杂度 同城或者异地建设,网络层面因素主要有三个: 1)跨区或者跨地域网络延时,对上层业务影响。 网络延时,通过优化基础设施手段是非常有限,毕竟受限于实际物理距离和光速。...混合云模式,这里考虑到IDC和云上线路灾情况,一般建议两条专线接入不同POP点来进行建设;同时建立VPN或者GRE公网逃生通道来紧急恢复业务。...注意:对于入口VIP写死情况,客户端升级成本较高。 image.png 3.2 混合云网络 混合云网络分为两个部分: 1)idc和云机房之间线路,主要线路分为专线和VPN。

4.5K93

数据中心精讲(常见建设模式)

当前,市场上常见模式可分为同城、异地、双活数据中心、两地三中心几种。...同城 同城是在同城或相近区域内(≤200KM)建立两个数据中心:一个为数据中心,负责日常生产运行;另一个为灾难备份中心,负责在灾难发生后应用系统运行。...同城灾难备份一般用于防范火灾、建筑物破坏、供电故障、计算机系统及人为破坏引起灾难。 异地 异地主备中心之间距离较远(>200KM)因此一般采用异步镜像,会有少量数据丢失。...两地三中心 结合近年国内出现大范围自然灾害,以同城双中心加异地备中心“两地三中心”备模式也随之出现,这一方案兼具高可用性和灾难备份能力。...异地备中心是指在异地城市建立一个备份备中心,用于双中心数据备份,当双中心出现自然灾害等原因而发生故障时,异地备中心可以用备份数据进行业务恢复。

2.3K20

备知识总结:与备份区别、备技术、体系规划

备份区别 (Disaster Tolerance):就是在上述灾难发生时,在保证生产系统数据尽量少丢失情况下,保持生存系统业务不间断地运行。...现在系统都包含着灾难恢复功能,所以本文讨论除了包括方面的内容,还包括了 灾难恢复部分内容。高性能、高可用平台架构演变过程。...系统在企业中给与数据安全系数相当高保障,但是系统倒是是什么,他们是什么意思?恐怕连正在使用备份网络管理人员都不能解释。本文用最浅显语言给大家解释备份到底是什么。...不能替换备份 系统会完整地把生产系统任何变化复制到端去,包括不想让它复制工作,比如不小心把计费系统内用户信息表删除了,同时 用户信息表也会被完整地删除。...如果是同步,那端同时就删除了;如果是异步,那端在数据异步复制间隔内就会被删除。这时就需要从备份系统 中取出最新备份,来恢复被错误删除信息。

8.8K21

服务与容错

引子 先介绍几个概念,同步一下认知: :是指系统冗余部署,当一处由于意外停止工作,整个系统应用还可以正常工作。 容错:是指在运行中出现错误(如上下游故障或概率性失败)仍可正常提供服务。...其他没有故障是可靠。 稳定性:这个业界没有明确定义,我理解是:在受到各种干扰时仍然能够提供符合预期服务能力。 从要求严格程度上:可用性<可靠性<稳定性。...可用性和可靠性更侧重于,而对稳定性同时包含和容错。 服务 服务解决方案就是冗余。多几个备份来切换。常用有N+1和两地三中心。N和中心实际上都是机房意思。...N是数据中心电力配置部分。电力配置有市电和备用发动机供电,但是一般互联网公司是不支持备用发动机供电。所以一般一个机房就是一个N。 N+1就是要多出一个机房做。...这个备份冷备和热备不同于数据库冷备和热备。数据库冷备是离线备份,就是不接收新流量情况下备份。热备是一边接收流量一边备份。 而通常服务冷备是服务还没有接收流量。

3K20

系列(四)——业务应用层建设

综上所述,本文从云平台视角出发阐述应用层业务建设,主要分为方案设计考虑纬度、复杂度以及云上客户案例三个方面。 1.应用概述 1.1 应用部署 应用是否满足跨地域/可用区部署?...1)业务完全能接受跨区延时,不同可用区应用部署规模(1:1),各承载50%业务流量; 2)业务并不能完全接受跨区延时,为了做业务做了部分妥协,两个可用区业务部署规模(5:1),主要业务承载在主可用区...切换强依赖于调度系统以及配置系统稳定性。这里稳定性主要包括系统能力和性能;遇到大规模故障,大量信息配置变更请求调度系统和配置系统要能扛住洪峰,是保障这个方案根基。...2.应用复杂度 计算应用层,主要考虑以下两个方面: 哪些节点执行任务。 这里要区分清楚哪些节点执行核心业务,这里会引入不同复杂度。...当前腾讯云dts已经支持mysql双向同步功能,详情见https://cloud.tencent.com/document/product/571/59386。

3.3K72

系列(七)——混合云公网出口建设

本文结合云平台公网能力,从网络平台角度来分析建设可行性。...2.公网出口方案 2.1 IDC和云平台出口互为主备 正常情况下,IDC和云平台公网出口流量是烟囱式,互不交叉;当IDC公网出口异常,流量切换到云平台,同样云平台公网出口异常,流量切换到IDC。...整体公网出口方案如下: image.png 2.1.1 云平台切换方案。 正常情况下,业务流量通过NAT访问公网,如上路绿色线条标识。...2.1.2 IDC切换方案 正常情况下,IDC业务流量通过NAT访问公网,如上路绿色线条标识。...IDC公网出口方案 (推荐) 1.方案简单,更多依赖云平台能力 2.方案落地快捷。 3.人力成本低,不需要自建系统。 4.维护成本低,不需要后续维护系统稳定性。

2.9K124

知识知多少

为什么要做? 你知道吗?自然灾害、设备故障、人为因素等都会造成业务中断。如今数字化时代,IT系统故障更会对公司业务造成难以估量巨大经济损失。...维斯康星州大学 2 监管要求 2011年,银监会发布《商业银行业务连续性监管指引》 2008年,保监会发布《保险业信息系统灾难恢复管理指引》 2008年,中国人民银行发布《银行业信息系统灾难恢复管理规范》 现在公司有责任建立完善管理体系...3 关键词 RPO(Recovery Point Objective) 数据恢复点目标,主要指的是业务系统最大能容忍数据丢失量。...体系介绍 1 数据中心 集团公司通过两地建立三个数据中心,通过双活、冷备等方式,实现两地三中心架构。...演习要求 每年进行演练,所有核心业务与平台系统均要参演。 异地备恢复、同城双活切换、一键式自动化启停等恢复方式不断创新,要求演习规模逐年扩大和恢复效率逐年提升。 - End - ----

1.2K20

前端接口

有没有不白屏方案? 有啊,还挺简单我细细细细分析。 原因就是接口挂了,拿不到数据了。那把数据储存起来就可以解决问题。 思考 存哪里? 第一时间反应浏览器本地存储,想起了四兄弟。...,5MB 一定不够,所以选择了 IndexDB。...考虑新用户或者长时间未访问老用户,会取不到缓存数据与陈旧数据。 因此准备上云,用阿里云存储,用 CDN 来保障。 总结下:线上 CDN、线下 IndexDB。...劣势包括使用局限,不适合对数据实效性比较高业务场景,不支持 IE 浏览器。 接口我们也是刚弄不久,有许多细节与不足,欢迎沟通交流。 接口本意是预防发生接口服务挂了场景,我们不会很被动。...原来是P0故障,能被它降低为 P2、P3,甚至在某些场景下都不会有用户反馈。

19710

业务切换案例

是确保系统可靠性很重要一环,一般分为:产品,业务。...产品主要就是将云产品做跨可用区或者跨地域部署,实现多地部署,如果某一个地域出现了问题时候,可以进行自动切换,确保整体可用。...业务,指的是从业务系统出发,对业务系统、中间件组件、网络、计算资源进行全面容部署。确保整个应用及应用所依赖组件能够在某一个区域出现问题时候,能够正常调度到其他正常区域。...本文主要讲下业务步骤及切换方案。 业务过程分位几部分: 1、评估。...根据业务架构及部署实际,规划出应用、各组件、网络计算方案。 3、实施。根据方案进行具体实施。 4、切换演练。

1.1K41

与集群(1)

World吧,Orleans是为分布式和云计算而生框架,那么今天我们就简单说一说、集群、与集群在Orleans中运用。...简单概述一下就是:通过技术手段将多台计算机(服务器)组合成“一台计算器”对外提供计算服务。 是什么?...技术是系统高可用性技术一个组成部分,系统更加强调处理外界环境对系统影响,特别是灾难性事件对整个IT节点影响,提供节点级别的系统恢复功能。...简单概述一下就是:当一些服务器不可用时可以切换到可用备用服务器上,提高服务可用性。 和集群关系?...个人认为是一种需求,目的,目标,而集群是一种技术手段,使用集群可以提供可用性和可缩放性,那么也解决了问题,当然方式不仅限于集群镜像站点也能解决问题。就好比IOC和DI关系一样。

1.6K40

系列(十)——数据热备能力建设【基础篇】

企业业务敏感程度差异,对指标RPO&RTO要求也不同。之前两篇文章主要介绍数据冷备,主要特点是数据备份存储非实时,备份系统存储数据通常昨天数据,当灾难真正来临时候,今天新产生数据会丢失情况。...异地明确数据热备能力,实时明确RPO指标接近于“零”。尤其是实时,对于RPO指标提升,为此需要企业投入更多成本。...2)备实例,建议采用云平台PAAS服务,更好兼容DTS同步服务。2.2 平台热备方案2.2.1 数据库备方案目前数据库对于异地备份能力进行封装,来简化云上客户操作成本,提升RTO。...方案关键因素详细说明范围地域级别RPO/RTORPO几乎接近为零;RTO为小时级别,进行1:1业务部署,依赖于业务部署和数据恢复自动化能力。...3.演练能力建设,增加平时运维成本以及自动化工具开发功能。

4.8K143

Hbase与备份

一、前言 本文主要介绍 Hbase 常用三种简单备份方案,即CopyTable、Export/Import、Snapshot。...已被删除数据等功能; 执行命令前,需先创建与原表结构相同新表; CopyTable 操作是基于 HBase Client API 进行,即采用 scan 进行查询, 采用 put 进行写入。...导出完成后,导出文件所有权将由执行导出命令用户所拥有。 默认情况下,仅导出给定 Cell 最新版本,而不管历史版本。要导出多个版本,需要将 参数替换为所需版本数。...因为快照存储仅仅是表元数据和 HFiles 信息。快照 clone 操作会从该快照创建新表,快照 restore 操作会将表内容还原到快照节点。...clone 和 restore 操作不需要复制任何数据,因为底层 HFiles(包含 HBase 表数据文件) 不会被修改,修改只是表元数据信息。

1.5K40

系列(十一)——数据热备能力建设【进阶篇】

业务数据备份采用热备方式,指标RPO接近“零”;但是RTO指标还是依赖于业务部署测试自动化能力。业务会进一步需要,在数据热备技术架构下,在成本可控情况下,是否能进一步提升RTO指标呢?...但是业务恢复指标RTO没质提升,主要是业务部署验证需要花费时间过于依赖企业运维自动化能力。如果在备地域不仅仅部署数据节点,同时将接入层,服务层均进行部署。...到了云时代,资源购买扩容变更加灵活,备区域按照1:0.1部署资源成为可能,当业务恢复时候,进行同比例扩容来承载线上业务。...mysql采用数据同步方式做实时备份,这里未采用数据库自带备实例,主要是由于备实例为只读,不方便平时做演练切换。...业务恢复业务恢复成本较低,如果以下两个方面做充分:1.备区日常业务验证能力,对于业务全面测试验证上线能力要求较高。2.演练能力建设,增加平时运维成本以及自动化工具开发功能。

5K94

关于那些事儿

​​,运维们都不会陌生词语。今天,我们来聊一聊关于那些事儿。 封面.jpg 关于级别的选择 备,是企业中一项重要技术应用,对于企业数据安全起到了很大作用。 ...RTO数值越小,代表系统数据恢复能力越强。我们可以部署很多系统,来获取最小RTO,但这意味着投入大量资金。...异地:某公司内部财务系统异地架构 2.png 级别:应用级技术:数据库复制(Oracle Dataguard)、应用配置文件复制; RTO:可达到分钟级别恢复; RPO:基本为异步传输数据排队时间...基于蓝鲸应用备演练 在上述“异地:某公司内部财务系统异地架构”中,已经告诉了大家备切换关键点有两个: 一个是web应用层,机房一直处于运行状态,但切换应用到备机房可能会涉及一些配置参数调整...本文主要是从容级别选择、系统指标、常见容技术及架构、以及应用备演练部分角度,来阐述对企业建设应用系统观点。

3.2K70

演练-故障切换

设计需要进行故障切换场景 设计过程当中需要考虑故障切换场景有很多,数据中心内部高可用切换不在本次讨论范围之内,我们讨论恢复过程中关键跨数据中心级故障切换场景,从网络层到存储层都会涉及到...4.2 HA数据库服务模式 所谓 HA数据库服务模式是指通过操作系统HA软件结合数据库服务实现架构,架构设计之初是为了实现各类应用服务本地服务器高可用,但双活技术兴起之后,也常常被用来作为近距离...(百公里内范围)双活数据库服务架构 。...Extended RAC之类架构 。...存储层故障切换策略 5.1 存储网关服务模式 所谓存储网关模式,我们在《企业选型指南- 2 :企业数据复制技术》当中介绍过, 就是在物理存储层之上增加一层网关技术,用以形成存储资源透明抽象层

2.7K31
领券