作者介绍 万守兵:腾讯云行业架构师,对云上双活架构、迁移方案有比较深的了解,现主要负责腾讯云泛互行业TOP级客户的解决方案架构工作。 高可用挑战 1. 高可用挑战:时间要求 2. 高可用挑战:各种不稳定的原因 常见事故及问题归类如下: 互联网通用架构和分层 典型互联网架构分层设计如下: 系统正交分解如下: 分类 服务治理 目标 技术 架构 监控层外层客户端SLA、攻防/扫描/审计 CDN合理/稳定
一、高可用的挑战 1、高可用挑战-要求 image.png 2、高可用挑战-各种不稳定的来源 常见事故及问题归类如下: image.png 二、互联网通用架构和分层 典型互联网架构分层设计如下: image.png 系统正交分解如下: 服务治理目标 技术架构 监控层 外层 客户端SLA 攻防/扫描/审计 CDN合理/稳定 DNS合理/稳定 流量峰值 CDN DNSPOD/Ip直连 高防 客户端监控 CDN监控 DNSPOD监控 安全监控 接入层 异地多活 服务
容灾设计过程当中需要考虑的故障切换的场景有很多,数据中心内部的高可用切换不在本次讨论范围之内,我们讨论的是容灾恢复过程中的关键跨数据中心级的故障切换场景,从网络层到存储层都会涉及到,其主要涉及如下几个方面:
产品容灾主要就是将云产品做跨可用区或者跨地域部署,实现多地部署,如果某一个地域出现了问题的时候,可以进行自动切换,确保整体可用。
最近有个集团级的云项目处于实施过程中,客户对数据备份、应用双活视为同一个事物,要求我方将原秒级数据备份升级为秒级应用双活。实际问题,备份与双活是不同的两个概念。以下我们用图文方式简述双活与数据备份的区别。
同城异地灾备,业务双活,其实也不过就是看看是否需要SLB或者GSLB或者DNS,在进行灾备的时候,最主要的还是DNS服务的提供,在进行切换的时候,大部分就是将DNS重新绑定IP地址,从而进行主从切换。。切换只不过是一个脚本。
在当今快速发展的数字化时代,业务的连续性和稳定性已成为企业核心竞争力的重要组成部分。然而,由于各种原因,企业常常面临着数据丢失、系统瘫痪等潜在风险。因此,制定一套科学、高效的容灾方案至关重要。本文将围绕某全球领先的工业集团如何通过灵雀云企业级云原生平台ACP(以下简称ACP)实现高效的容灾方案展开深入探讨,旨在为您提供可借鉴的经验和启示。
实现业务连续性的技术手段通常包括高可用性和灾备恢复两种,所以本文讲述的是在腾讯云上实现业务连续性的解决方案。
✦ DNS解析是什么 ✦ 域名,是云计算服务中不可或缺的基础服务。 DNS,负责决定域名怎么使⽤,让域名指向哪⾥,将域名转换成为机器可读的IP地址服务。 使用云服务的用户,就会有域名。 只要有域名,就会用到DNS解析。 域名 DNS解析 ✦ DNS解析解决什么问题 ✦ 1. 域名解析加速,访问体验提升 场景:站点加载速度非常慢,一直转圈圈,甚至提示「当前站点故障」无法访问的情况,严重影响用户体验。 解决:DNSPod 的解析线路包含国内 34 个省份、各大小运营商、各大搜索引擎及海外 247
腾讯云上部分客户,基于腾讯云云产品能力,在同地域不同可用区,快速构建了业务级别的同城双活架构(如下图)。具备了单产品/单链路的高可用能力,同时也具备同城单可用区异常时的容灾的能力。
本文整理自爱奇艺高级研发师何聪在 Apache APISIX Meetup - 上海站的演讲,通过阅读本文,您可以了解到基于 Apache APISIX 网关,爱奇艺技术团队是如何进行公司架构的更新与融合,打造出全新的网关服务。欢迎感兴趣的同学点击阅读原文访问 bilibili 观看视频。 作者何聪,高级研发师,IIG 基础架构部 - 计算云,主要负责爱奇艺网关开发和运维工作
上篇我们介绍了DNS流量负载和容灾切换功能的意义,下面我们将继续介绍基于DNS的全局负载均衡的工作原理和相关知识。 如果你想了解DNS访问的整个流程,可以先查看DNS的基本原理(可查看文章DNS原理及解析过程详解)。对于更好地讲解全局流量负载有所帮助。
最近有很多站长朋友想了解腾讯云WEB应用防火墙(WAF)如何修改DNS解析?小编赵一八笔记特意从网上整理相关资料,希望可以帮到大家。
我是来自网易云信的张根宁,今天我将会站在用户的角度来跟大家探讨播放器的相关优化,也会详细阐述网易云信团队在播放器方面都做了哪些努力。
越来越多的企业在数字化转型和上云进程中选择混合云的形态(云+自建 IDC 或云+其他厂商云)来进行容灾建设,一方面不会过度依赖单一云厂商,另一方面还能充分利用已有的线下 IDC 资源。
IGTM是什么? 腾讯云智能全局流量管理(Intelligent Global Traffic Management),简称IGTM,可以帮助用户实现应用服务的高并发负载均摊、应用服务的健康检查,并能够根据健康检查结果实现故障隔离或流量切换,方便用户灵活快速的构建同城多活和异地容灾等高可用服务。 IGMT做什么? 1、主备容灾。当你为业务部署资源,既配置了电信IP,又配置了移动IP,正常情况用电信的,一旦发现电信的不通了,就启用移动的,等电信正常后,再换回到电信IP。 2、多活。 你有多个IP池同时向用户
如上图,两地三中心的架构,是为了提高系统的容错、容灾的能力。当一个数据中心不可用时,能够将关键业务的流量切换到其他数据中心,可以抵御城市级的自然灾害。
灾备,又称灾难恢复(disaster recovery)。指的是, 发生灾难时恢复业务的能力。这就意味着已经发生了灾难,进行补救。它的流程是,前期准备,发现灾难,应对灾难。 大多数系统的自动灾备依赖外部系统实现,一些关键模块则使用分布式共识算法实现内部灾备。
单点故障是实际生产中无法避免的,单副本的存储方案也早已无法满足业务的可靠性要求。现在,我们通常都会做双机存储架构,会涉及到主备、主从、主主模式。
业务容灾是所有容灾中最复杂的一种场景,涉及到业务应用、中间件、数据库及底层的计算、存储、网络等资源。就云上业务容灾来讲整个容灾覆盖到IaaS、PaaS、SaaS层。在容灾方案确认并且实施落地之后,就需要进行容灾切换演练工作。下面主要介绍下容灾切换演练的流程及具体操作细节。
第一部分:高可用设计 一、Openshift架构 Openshift架构如上图,其核心组件有: ●Multiple Masters ●External etcd ●Routers ●Registr
GTM(Global Traffic Manager的简写)即全局流量管理,基于网宿智能DNS、分布式监控体系,实现实时故障切换及全球负载均衡,保障应用服务的持续高可用性。GTM基于资源的健康状况及流量负载做智能调度决策,为用户提供最佳访问IP。网宿GTM,提供更可靠、稳定和安全的流量调度服务,助您轻松构建混合云应用。
dns服务有什么用呢,尤其是内网的dns服务,其实用处还蛮大的,我见过的典型使用,是数据库跨机房多活。
本文介绍了蚂蚁金服异地多活单元化架构的原理,以及微服务体系在此架构下的关键技术实现。
说起容灾,很多同学脑子冒出来熟悉字眼,”同城双活”,“两地三中心”,“单元化”,“set化”等等。其实这些名词背后均隐射一层含义,面对一些灾难时候,业务如何做冗余来快速恢复业务。
腾讯云对象存储 COS 为客户提供了99.95%的可用性和99.999999999%的可靠性。由此可见,数据可靠性是极高的,即使在极端故障场景下,也可以保证客户的数据不丢失。但实际线上系统更常遇见的是,因为网络拥塞、程序异常等原因,而导致的COS服务不可用,如对象读写失败,API调用异常等。当这些故障发生时,如果没有合适的冗余措施,即使存量数据不丢失,也会造成一段时间线上服务有损,影响用户使用体验。本文会结合一些客户的实际案例介绍一种COS服务的高可用方案。
CDN已经成为互联网重要的基建之一,越来越多的网络服务离不开CDN,它的稳定性也直接影响到业务的可用性。CDN的容灾一直由美团的SRE团队在负责,在端侧鲜有方案和实践。
当前市场上常见的容灾模式可分为同城容灾、异地容灾、双活 数据中心、两地 三中心几种。
什么是负载均衡呢?用户输入的流量通过负载均衡器按照某种负载均衡算法把流量均匀地分散到后端的多个服务器上,接收到请求的服务器可以独立的响应请求,达到负载分担的目的。从应用场景上来说,常见的负载均衡模型有全局负载均衡和集群内负载均衡,从产品形态角度来说,又可以分为硬件负载均衡和软件负载均衡。
时至今日,企业运作和业务运营对于IT系统的依赖性越来越高,对于IT系统的稳定性和可靠性的要求也越来越高。然而,"天有不测风云,人有旦夕祸福",一旦IT系统因为天灾或人为因素等等意外事故导致系统毁坏而长期无法运行,将造成整个企业在营运上的重大损失。曾几何时支付宝、携程等互联网企业由于IT系统技术故障而相继“瘫痪”,更是从反面说明了容灾系统建设的重要性。
多云是指企业使用两个或更多的公有云 IaaS 供应商。广义来看,混合云也在其范畴。多云架构有如下优势:
容错(fault tolerance)指的是, 单个组件发生故障时,业务还能继续运行。
腾讯云 DNSPod 向全网域名提供智能解析服务,拥有海量数据处理能力、灵活扩展性和安全能力。为客户提供从基础的域名解析、Private DNS、IGTM智能流量管理、Public DNS和HTTPDNS递归解析等服务,一站式解决客户DNS所有场景需求并提供定制化服务。 01 自研F-stack 解析质量和性能大幅提升 F-Stack是基于kernel bypass的理念的完整的、成熟的、易用的、高性能server技术栈。 腾讯云 DNSPod 的权威 DNS 目前包含两个架构版本,基于 F-Stack
异地多活相对于异地热备,最大不同点在于应用在不同地域都承载流量,从业务流量调度,数据同步以及业务性能等方面技术复杂度会大幅度的提升。同时业务异地多活有一个前提,就是业务支持单元化部署,这里对存量有历史技术债业务也存在非常大的挑战。因此本篇幅讨论异地多活前提是,业务已经具备单元化部署的能力。
前言 当你的网站或者APP访问量日渐增多,用户体验却持续下降,服务器性能严重不足的时候,选择接入CDN是大多数情况要必须做的,当你在众多CDN厂商中好不容易选择了一家(不知怎么选择,可以闭眼选择腾讯云CDN🙂),进行配置的时候,不要简单的认为按照入门文档配置完就觉得万事大吉了。很多案例证明,接入CDN只是一小步,后面出现的各种问题,会让你抓狂。下面我们就来讲讲如何用好CDN,让它发挥出最佳效能。以下涉及到的CDN事项,将以腾讯云CDN作为案例,仅供参考。 Step1. 资源划分
业务数据备份采用热备方式,容灾指标RPO接近“零”;但是RTO指标还是依赖于业务部署测试自动化能力。业务会进一步需要,在数据热备技术架构下,在成本可控的情况下,是否能进一步提升RTO指标呢? 本文结合云平台的能力,来进一步讨论这个话题。
同城异地灾备,主要是用来进行备份容灾的,从而当一个数据中心挂了,另外一个数据中心经过切换之后,能让服务迅速的恢复。
前言 当你的网站或者APP访问量日渐增多,用户体验却持续下降,服务器性能严重不足的时候,选择接入CDN是大多数情况要必须做的,当你在众多CDN厂商中好不容易选择了一家(不知怎么选择,可以闭眼选择腾讯云CDN🙂),进行配置的时候,不要简单的认为按照入门文档配置完就觉得万事大吉了。很多案例证明,接入CDN只是一小步,后面出现的各种问题,会让你抓狂。下面我们就来讲讲如何用好CDN,让它发挥出最佳效能。以下涉及到的CDN事项,将以腾讯云CDN作为案例。 Step1. 资源划分
如果您有自建源站和直播源内容,并且需要通过腾讯云进行直播播放,可以通过为云直播播放域名设置源站信息来回源拉取直播内容。配置成功后,您可通过云直播回源拉流并进行直播内容分发。
CDN 是 Content Delivery Network 的缩写,表示的是内容分发网络。CDN 的作用是把用户需要的内容分发到离用户最近的地方,这样可以是用户能够快熟获取所需要的内容。CDN 其实就是一种网络缓存技术,能够把一些相对稳定的资源放到距离最终用户较近的地方,一方面可以节省整个广域网的贷款消耗,另外一方面可以提升用户的访问速度,改进用户体验。我们一般会把静态的文件(图片、脚本、静态页面)放到 CDN 中
当下,随着数字化技术不断深入,愈来愈多企业将核心业务搬到线上。业务系统高可用、可扩展、容灾能力决定企业系统的连续性,中间件作为构建企业核心系统的重要组成部分,其高可用容灾能力也将决定应用系统的。本文结合腾讯云中间件各PaaS产品的容灾能力及实践,以一个行业头部客户业务容灾实践举例,来展开说明基于腾讯云中间件PaaS层相关产品的实践。
数据中心运行突发故障(如:天灾不可避免的灾难)是无法预测的,计算机里的数据就像扫雷游戏一样,十面埋伏充满雷区,随时都有可能Game Over,容灾备份就是数据安全的最后防线,是你可以避免由数据中心发生故障而丢失数据引发的不可挽回的局面。
当他睡眼惺忪、手拿红牛、嘴刁香烟迈着沉重的步伐从某网络核心机房走出来的时候,除了看门大爷简短问候之外,也只有刚刚过去的这个黑夜才真正懂得刚刚发生了什么,在外人眼里,这个夜晚再正常不过,和往常一样,刷刷微博、看看抖音,逛逛购物网站,即便是前一晚上有某些人觉得打开购物网站的页面有点卡慢,他们也可能不会放在心上,然而正是因为这样一个不一样的网络体验,网络工程师们已经是废寝忘食,鏖战了整整一夜,来修复引发这个网络卡慢的bug,在外人眼里一觉醒来,看似波澜不惊,但有时实则是暗流涌动;
相对于过去单体或 SOA 架构,建设微服务架构所依赖的组件发生了改变,因此分析与设计高可用容灾架构方案的思路也随之改变,本文对微服务架构落地过程中的几种常见容灾高可用方案展开分析。
近期某客户需要考虑NAT网关跨地域的灾备方案,用于在上海地域运营商网络中断等场景,可以借助腾讯云内网,将对外访问的流量调度到异地出口。
【数商云】电子商务网站建设公司为各种规模的企业提供灵活、安全、稳定、高效的智慧电商解决方案,帮助电商企业从容面对业务高峰、安全压力等,在市场竞争中脱颖而出。通过弹性扩缩架构,快速实现应用容器化部署,弹性扩缩;高可用,高性能,开发友好,降低人员成本。100T储备带宽、全球 1300+ CDN 节点、高达T级的防护服务,助力电子商务企业从容应对促销活动的超大流量。通过 EMR 快速构建 Hadoop 集群,结合多样化工具,精准用户画像,轻松实现商城网站低成本高效率的大数据处理。
傍晚时分,你坐在屋檐下,看着天慢慢地黑下去,心里寂寞而凄凉,感到自己的生命被剥夺了。当时我是个年轻人,但我害怕这样生活下去,衰老下去。在我看来,这是比死亡更可怕的事。--------王小波
随着业务对持续性要求越来越高,云上不少企业对跨AZ或多地域的容灾建设有强烈的诉求。当企业内部经过评估选定容灾建设整体方向,即同城双活;需要对方案进行验证,包括组件容灾能力建设,数据同步以及切换验证等。通常对组件容灾能力建设和验证会花费大量时间,如果测试不符合预期,对之前调研、部署以及测试人力和时间成本带来较大耗费。因此借助云平台能力“一站式”提升系统容灾能力,助力企业降本增效。
领取专属 10元无门槛券
手把手带您无忧上云