首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

从0到1:美团端侧CDN容灾解决方案

从0到1:美团端侧CDN容灾解决方案

云计算是当今技术发展的关键推动力,它可以提供动态扩展和高可用性服务。然而,云计算本身存在一些限制,例如网络延迟和流量峰值。针对这些情况,美团开发了基于端侧内容分发网络(CDN)的容灾解决方案,以确保用户的访问体验和服务的可靠性。

名词概念、分类、优势:

  1. 名词概念:CDN(Content Delivery Network,内容分发网络)是一种分布式网络,通过全球节点缓存、加速、分发内容,让用户能够就近访问高质量的内容资源,提高网络响应速度。
  2. 分类:CDN可以分为客户端(客户端 CDN)、服务端(服务器 CDN)和云侧(云 CDN)三种类型。美团端侧 CDN 解决方案是在终端设备(如手机、平板、PC)上实现客户端 CDN,减轻服务器负担,确保在突发流量或网络异常时仍然能够提供稳定访问。
  3. 优势:
  4. 确保低延迟的访问体验,提升用户使用效率;
  5. 全球范围的内容加速,减少跨洋网络延迟;
  6. 增强业务的抗干扰能力,保证服务的高可用性和可靠性;
  7. 可快速应对流量峰值,为业务发展带来灵活性。

应用场景:

  1. APP/微信小程序:美团作为生活服务领域的领导者,有大量用户在使用APP和小程序进行在线点餐、外卖下单、购买电影票、预订酒店等服务。在遇到突发流量或节假日等场景,如用户访问量突增,美团可以通过端侧 CDN 分发内容,实现缓存加速,确保业务稳定运行,提升用户体验。
  2. 视频会议/在线教育:当网络质量不佳时,端侧 CDN 可以缓解服务器的压力,减少视频卡顿、延迟等,优化在线教育平台、直播电商等业务的流畅度,提高用户体验。
  3. 游戏/直播:对于流量突发和并发需求极高的游戏业务,端侧 CDN 可以提供实时缓存加速和动态调整带宽保证。对于直播业务,可以使用端侧 CDN 以降低服务器负担,实现跨域播放、无缝切换等功能。

推荐的腾讯云相关产品:

  1. CDN:腾讯云 CDN 提供了丰富的全球节点、高可靠、极速高效的缓存、压缩等特性,让用户可以享受到低延迟的访问体验和高可用性的服务。

链接地址:https://cloud.tencent.com/product/cdn/Overview

  1. 负载均衡:腾讯云负载均衡通过自动分配请求至多个服务器,实现服务的高可用性和扩展性。

链接地址:https://cloud.tencent.com/product/la

综上,美团针对CDN的端侧容灾解决方案能够充分利用云计算的优势,确保服务质量。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

01CDN解决方案

2022年 第002篇 CDN已经成为互联网重要的基建之一,越来越多的网络服务离不开CDN,它的稳定性也直接影响业务的可用性。CDN一直由的SRE团队在负责,在鲜有方案和实践。...今天,我们主要介绍一下外卖技术团队 CDN方案,经过实践,我们发现该产品能有效减少运维及业务开发同学的焦虑,希望我们的这些经验也能够帮助更多的技术团队。 2....如何更有效的进行 CDN ,降低 CDN 异常对业务的影响,是我们不断思考的问题。 既然以上问题 SRE 无法完美地解决,是不是可以进行一些尝试呢?比如将 CDN 前置终端。...如果将 CDN 前置终端,无论时效性,精准性,都是 SRE 无法比拟的。在进行,就需要感知 CDN 的可用性,然后实现自动切换的能力。...4.1 总体设计 图 1 Phoenix CDN 方案主要由五部分组成: SDK:负责资源加载感知,CDN 切换重试,监控上报。

92920

01构建压测工具

内部的RPC服务大多构建在Thrift之上,在日常开发服务的过程中,需要针对这些服务进行压力测试(以下简称压测)来发现潜在问题。...现在主流的压测工具主要有以下几个: JMeter JMeter是一个比较老牌的压测工具,主要针对HTTP服务进行打压,该工具在以下方面并不满足内部的压测需求: 默认不支持Thrift的打压测试 需要本地安装...目标 针对之前提到的痛点,新的压测工具主要提供以下功能: 线上流量拷贝 简单易用的操作界面(接入压测的时间应该控制在1小时以内) 清晰的图表能反映压测应用的各项指标 满足包括Thrift、HTTP等服务的压测需求...一个典型的压测过程如图所示,首先在init方法里面,进行一些初始化的工作,比如连接数据库,创建客户等。...实践 拷贝流量 内部的服务大多使用Java来构建,VCR以Maven Package的方式提供给用户。 对用户来说只需要2行代码可以拷贝流量。

1K60

01学习边缘容器系列-3】应用之边缘自治

用户想要既享受 kubernetes 带来方便的管理运维,同时也要具备弱网环境下的能力。这对传统标准 kubernentes 解决方案提出了挑战。...[两者网络模式对比] 考虑弱网、断网情况,需要保证节点的组件与云端组件“通信”,或者说让节点认为此时还是可以“通信”的。如上图所示,我们在边缘加了一层镜像 lite-apiserver 组件。...在边缘容器场景下,考虑适配性以及易用性,我们采用了 flannel 组件的 vxlan 模式作为网络解决方案。flannel 组件保证了跨节点之前的网络访问。...DNS解决方案 用户业务对外正常提供服务,以及集群内微服务之间互相调用,这些问题都会涉及域名解析。...适用场景 腾讯云边缘容器产品支持用户在云端通过 kubernetes 方式来管理边缘节点,支持管控平台与 work 节点网络环境分离,具备弱网环境下的能力,支持用户自定义网络流量,并且所有核心组件都与开源

1.2K94

01学习边缘容器系列-3】应用之边缘自治

用户想要既享受 kubernetes 带来方便的管理运维,同时也要具备弱网环境下的能力。这对传统标准 kubernentes 解决方案提出了挑战。...DNS解决方案 用户业务对外正常提供服务,以及集群内微服务之间互相调用,这些问题都会涉及域名解析。...适用场景 腾讯云边缘容器产品支持用户在云端通过 kubernetes 方式来管理边缘节点,支持管控平台与 work 节点网络环境分离,具备弱网环境下的能力,支持用户自定义网络流量,并且所有核心组件都与开源...【边缘容器系列】往期回顾 1.【01学习边缘容器系列】之 边缘计算与边缘容器的起源 2....【01学习边缘容器系列】之 边缘应用管理 腾讯云原生 汇聚腾讯云原生技术 最新资讯、最佳实践、最真案例、最火活动 扫描二维码 关注我们

67510

配送系统架构演进实践

本文将为大家介绍配送的一些思考与实践。 配送业务 物流到同城即时配送 物流行业的发展离不开商业的发展,近些年,商业的变革为物流发展创造了新的机会。...能力 能力建设上,首先思考的问题是系统最大的风险点是什么。管理的角度来看,职责的“灰色地带”通常是系统质量容易出现风险的地方。...因此,早期最先做的处理是核心依赖、第三方依赖的降级,优先保证一旦依赖的服务、中间件出现问题,系统自身具备最基本的降级能力。 第二阶段我们提出了能力。...第三阶段,我们期望将预案集成系统中,基于各类事故场景打造定制化、一体化的工具,这样可以进一步缩短故障的响应、处理时间以及研发学习成本。...例如,为了进一步提升配送系统的SLA,我们在能力上深度优化,重点解决了骑手弱网、无网的情况下的交互问题。

1.5K30

万亿级 KV 存储架构与实践

点评 KV 存储发展历程 第一代的分布式 KV 存储如下图左侧的架构所示,相信很多公司都经历过这个阶段。...宏观的角度来看,高可用就是指怎么做。比如说挂掉了一个节点,你该怎么做?一个机房或者说某个地域的一批机房宕机了,你该怎么做?而微观的角度看,高可用就是怎么能保证的高成功率。...我们在做一些运维升级或者扩缩数据迁移的时候,能否做到业务请求的高可用?本文也会宏观和微观两个角度来分享做的一些高可用工作。 ? Squirrel 架构 ? ?...B 节点正常处理完客户的读写请求之后,还会把本应该写入 A 节点的分片 1&2 数据写入本地的 Log 中。 ?...作者简介 点评高级技术专家,2014 年加入。 来源:技术团队

1K20

超大规模数据库集群保稳系列之三:数据库容体系建设实践

1 介绍 我们通常会把故障分为三大类,一是主机故障,二是机房故障,三是地域故障。每类故障都有各自的诱发因素,而主机机房再到地域,故障发生概率依次越来越小,而故障的影响却越来越大。...2 业务架构 | 2.1 架构演进 架构最早期的单活形态(同城主备)同城多活形态,再演化异地多活,根据这个路径可以将分为1.0、2.0、3.0三个阶段。...下面会介绍一下架构。 | 2.2 架构 架构主要包括两种,一种是N+1架构,一种是SET化架构。...简化示意图如下: 内部的大部分业务都是N+1架构,外卖和金融等业务采用了单元化架构。总体上内部既有同城多活,也有异地多活,两种方案并存。...3.4.1 容量达标 数据库建立了一套N+1计算标准,分为6个等级,如果集群等级≥4级则达标,否则不达标。 标准可以看出,等级3开始就是多机房部署了。

29710

万亿级 KV 存储架构与实践

在 2019 年 QCon 全球软件开发大会(上海站)上,高级技术专家齐泽斌分享了《点评万亿级 KV 存储架构与实践》,本文系演讲内容的整理,第一部分讲述了 KV 存储的发展历程;第二部分阐述了内存...点评 KV 存储发展历程 第一代的分布式 KV 存储如下图左侧的架构所示,相信很多公司都经历过这个阶段。...宏观的角度来看,高可用就是指怎么做。比如说挂掉了一个节点,你该怎么做?一个机房或者说某个地域的一批机房宕机了,你该怎么做?而微观的角度看,高可用就是怎么能保证的高成功率。...我们在做一些运维升级或者扩缩数据迁移的时候,能否做到业务请求的高可用?本文也会宏观和微观两个角度来分享做的一些高可用工作。 ? Squirrel 架构 上图就是我们的 Squirrel 架构。...Cellar 跨地域 下面我介绍一下 Cellar 跨地域是怎么做的。Cellar 跟 Squirrel 面对的跨地域问题是一样的,解决方案同样也是集群间复制。

2.9K2018

客户案例--利用CDN备份源站实现COS双写双读

腾讯云也给出了其中一个解决方案,通过腾讯云云云函数SCF,来实现主备存储桶的定时拨测和邮件告警,在主存储桶宕机不可用的时候,有业务程序实现切换读写存储桶。...所以,利用CDN热备源站进程读请求,具备一定的局限性,如果客户属于会对同一个资源发起多次访问的场景,适合采用本方法。...如果客户是对不同对象仅访问一次,或访问频率很高,在主存储桶故障故障发生时,可能不能起到较好的效果。...两种方案的对比 根据上文的说明,我们总结了两种方案的对比供参考,业务可根据实际情况做适配选择。...效果 无法自动切换,部分场景下业务有损 可以自动切换,自动回切,适配行更强,需客户开发

1.3K50

集群调度系统HULK技术演进

业务扩容流程长:申请机器、资源审核服务部署,需要5分钟才能完成。...解法:类似于分布式调用链中的TraceId,每次扩缩会生成一个TaskId,我们在关键链路上进行打点的同时带上TaskId,并按照约定的格式统一接入点评日志中心,然后在可视化平台HULK Portal...实例的扩展配置:如部分业务,比如某些服务想将实例部署在包含特定硬件的宿主机,会对核心业务有N+1需求,并且还需要将实例部署在不同的IDC上。 相同配置的应用可以创建一个组,将应用和组进行关联。...4.5 时效问题 ?...业务: 业务迁移:建设了全自动化迁移平台,帮助业务VM自动迁移到容器,极大地降低了因迁移而带来的人力投入。

58410

集群调度系统HULK技术演进

业务扩容流程长:申请机器、资源审核服务部署,需要5分钟才能完成。...解法:类似于分布式调用链中的TraceId,每次扩缩会生成一个TaskId,我们在关键链路上进行打点的同时带上TaskId,并按照约定的格式统一接入点评日志中心,然后在可视化平台HULK Portal...实例的扩展配置:如部分业务,比如某些服务想将实例部署在包含特定硬件的宿主机,会对核心业务有N+1需求,并且还需要将实例部署在不同的IDC上。 相同配置的应用可以创建一个组,将应用和组进行关联。...4.5 时效问题 ?...业务: 业务迁移:建设了全自动化迁移平台,帮助业务VM自动迁移到容器,极大地降低了因迁移而带来的人力投入。

1K40

腾讯视频Node.js服务是如何支撑国庆阅兵直播高并发的?

TGW(Tencent Gateway), TGW主要处理容、负载匀衡; 请求TGW(STGW)转发到业务层Nginx,在Nginx中也会有简单的策略(主要由max_fails,fail_timeout...三、三层策略 如果上面守护异常,或是底层的依赖服务挂了,H5页面有三层策略。 ? 策略示意图 1. 接口 接口主要应对依赖的底层接口异常。...NodeJS 主要应对NodeJS工作异常,当NodeJS进程正常响应时,把静态的HTML推到CDN作为备份文件, 如果NodeJS返回5xx时, 在Nginx代理层重定向静态备份文件。...CDN、Nginxredis,每一层的工作量、业务侵入性,粒度不一样,业务需要根据自身场景, 选用适合自己业务的缓存即可。...监控示意图 客户提供了前端监控和告警,提供用户的监控,比如页面质量,CGI质量, 用户流水及手动上报的能力。

1.5K12

腾讯视频 Node.js 服务是如何支撑国庆阅兵直播高并发的?

TGW(Tencent Gateway), TGW主要处理容、负载匀衡; 请求TGW(STGW)转发到业务层Nginx,在Nginx中也会有简单的策略(主要由max_fails,fail_timeout...三、三层策略 如果上面守护异常,或是底层的依赖服务挂了,H5页面有三层策略。 ? 策略示意图 1. 接口 接口主要应对依赖的底层接口异常。...NodeJS 主要应对NodeJS工作异常,当NodeJS进程正常响应时,把静态的HTML推到CDN作为备份文件, 如果NodeJS返回5xx时, 在Nginx代理层重定向静态备份文件。...CDN、Nginxredis,每一层的工作量、业务侵入性,粒度不一样,业务需要根据自身场景, 选用适合自己业务的缓存即可。...监控示意图 客户提供了前端监控和告警,提供用户的监控,比如页面质量,CGI质量, 用户流水及手动上报的能力。

1.1K21

追前沿,领略SET化架构衍化与设计

BAT/TMD大厂单元化架构设计衍变之路分享 随着大型互联网公司业务的多元化发展,就拿滴滴、等大厂来讲,如滴滴打车、单车、外卖、酒店、旅行、金融等业务持续高速增长,单个大型分布式体系的集群,通过加机器...以滴滴打车、外卖举例来说: 打车业务体量巨大,尤其在早晚高峰期。全年订单量已越10亿。...所有处于对业务扩展性以及需求的考虑,我们需要一套底层架构彻底解决问题的方案,业界主流解决方案: SET单元化架构方案(阿里、支付宝、饿了么、微信等) 同城 "双活" 架构介绍 目前很多大型互联网公司的业务架构可以理解为同城...,支撑业务的高速方案 通用性:架构形成统一通用的解决方案,方面各业务线接入使用 SET化架构设计: SET化架构策略 流量路由: 按照特殊的key(通常为userid)进行路由,判断某次请求该路由中心集群还是单元化集群...上已经明确定义Bindings关系的Exchange,也就是有实际的物理Queue来接收消息,才会Upstream拉取消息Downstream。

60220

【玩转腾讯云】如何构建云端高可用架构!

作者介绍 万守兵:腾讯云行业架构师,对云上双活架构、迁移方案有比较深的了解,现主要负责腾讯云泛互行业TOP级客户的解决方案架构工作。 ? ? ?  高可用挑战  1.  高可用挑战:时间要求 ?...接入层LB高可用 腾讯云CLB底层是基于TGW,本身具有高可用,具体如下: 1)多级 跨园区 ->交换机 机架-> TGW集群 2)防攻击 流量攻击:过载保护 DDOS攻击:syn...CBD高可用  故障一:数据库节点异常 只读库、备实例数据正常; 后台隐藏实例可快速恢复业务; 后续动作需要后台新建隐藏库实例; 故障二:可用区异常 主库及只读库无法访问; 手动切换备实例为主实例...移动高可用  故障演练; 移动报警平台; 移动热修复; 移动 HttpDns/IP直连/长链接push推送优化; 移动监控响应时间/奔溃卡顿/启动时间/功耗/网络质量/CDN监控;  ...网站全套服务:01 存储分发加速解决方案! 混合云存储:大数据应用的上云之道! 腾讯云COS全球加速让全球用户加速访问! 基于SCF+CloudMonitor实现COS敏感操作监控告警!

2.4K40

前端研发框架Rome实践和演进趋势

本文整理自技术沙龙第76期《大前端研发协同效能提升与实践》,为大家介绍了店前端研发框架Rome实践和演进趋势。...第二维度是业务维度,店业务迭代频次比较高,基础工程框架不仅要保证交付速度快,同时还对质量有很高的要求。...基础基建对接 工程能力:一行代码引入公司基建(CDN) 当前端同学处理如CDN厂商故障等问题时,需要自行查找、学习和使用公司/开源的基建能力,解决成本较高,但在Rome开发过程中可以通过开闭式的配置一键...CDN生效,如下图,接入后会自动进行静态资源的降级重试,当业务出现故障时(即下图峰值部分),它会有一个明显的资源加载重试,这就是降级CDN在生效;对业务同学来说只需配置框架需要哪个能力就行,其详细配置如何注入大家并不需要太关注...,有B系统、C的H5,还有我们内部的React Native。

34530

前端遇上Go: 静态资源增量更新的新实践

总第259篇 2018年 第51篇 为什么要做增量更新 金融的业务在过去的一段时间里发展非常快速。在业务增长的同时,我们也注意,很多用户的支付环境,其实是在弱网环境中的。...例如,我们要生成字符串“abcdefg”“acdz”的增量补丁,那么一个补丁的全文就类似如下: =1\t-1\t=2\t-3\t+z 这个补丁当中,制表符\t是指令的分隔符,=表示保留,-表示删除,...如何 有关,我们总结了以往见到的一些常见故障,分了四个门类来处理。 线路故障。...最后,在这套服务之外,我们浏览器的 SDK 也有自己的机制。我们在增量更新系统之外,单独部署了一套 CDN ,这套 CDN 只存储全量文件。...2014年加入小米云平台,同时负责网页前端开发、客户开发及路由器固件开发,积累了丰富的开发经验。2017年加入,现负责金服平台基础组件的开发工作。

97920

即时物流的分布式系统架构设计

背景 外卖已经发展了五年,即时物流探索也经历了3年多的时间,业务零孵化初具规模,在整个过程中积累了一些分布式高并发系统的建设经验。...上图是比较典型的技术体系下的分布式系统结构:依托了公共组件和服务,完成了分区扩容、和监控的能力。...单元化尝试 相比多中心来说,单元化是进行分区和扩容的更优方案。关于流量路由,主要是根据业务特点,采用区域或城市进行路由。数据同步上,异地会出现延迟状况。...最后,就是单元化之后,集群为单位的运维以单元为单位的运维,也给业务部署能力带来很大的挑战。 作者简介 宋斌,资深技术专家,长期参与分布式系统架构、高并发系统稳定性保障相关工作。...2013年加入,参与过外卖C、即时物流体系零搭建。现在带领团队负责调度、清结算、LBS、定价等业务系统、算法数据平台、稳定性保障平台等技术平台的研发和运维。

76310

世界杯直播技术揭秘及视频云直播回源系统的应用

其次是。回源链路上,每一层都需要有。首先是源站的,我们采取主备流的方式保证链路的可靠性,对于有多个源站的客户,尤其重要。...同理,其它每一层也有的策略,如0层自身故障,1层会切换到其它0层机器进行回源。 除了针对单点的故障,我们采取异地部署来防止单个区域的故障. 当失效时,会采用柔性策略。...另一方面通过10层的收敛,来尽可能确保同一时间只有一台机器在切片。...第一个是强一致的,第二个是弱一致的,若出现因内网故障导致1层在一定时间段回源0层备用机器,可能会导致最终不同CDN边缘节点拿到的m3u8有延迟(解决办法,播放器播放时采用长连接获取ts或缓存cdn ip...,不切换cdn边缘节点;另一个是切片发送ts序列时延迟一个,用延迟抵消404的可能) 低延迟 低延迟有两个含义,一个是播放和推流断的绝对时间延迟,一个是播放开始拉流到看到第一帧画面的延迟。

1.3K30

外卖分布式系统架构设计

背景 外卖已经发展了五年,即时物流探索也经历了3年多的时间,业务零孵化初具规模,在整个过程中积累了一些分布式高并发系统的建设经验。...分布式系统实践 上图是比较典型的技术体系下的分布式系统结构:依托了公共组件和服务,完成了分区扩容、和监控的能力。...单元化尝试 相比多中心来说,单元化是进行分区和扩容的更优方案。关于流量路由,主要是根据业务特点,采用区域或城市进行路由。数据同步上,异地会出现延迟状况。...最后,就是单元化之后,集群为单位的运维以单元为单位的运维,也给业务部署能力带来很大的挑战。 作者简介 宋斌,资深技术专家,长期参与分布式系统架构、高并发系统稳定性保障相关工作。...2013年加入,参与过外卖C、即时物流体系零搭建。现在带领团队负责调度、清结算、LBS、定价等业务系统、算法数据平台、稳定性保障平台等技术平台的研发和运维。

88810
领券