首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何快速构建稳定、低延时的多人游戏的部署环境?

腾讯游戏服务器引擎(Game Server Engine,缩写GSE),支持有状态的游戏服务部署和,实现服务发现、高效灵活的服务器伸缩和就近调度的能力,帮助开发者快速构建稳定、低延时的多人游戏的部署环境...这是一个有状态的场景:对于游戏服务,尤其是对战服务来说,不能是简单添加一个clb(负载均衡)就能搞定。在游戏服务里需要断线重连,能找到之前连接的服务器;另外游戏过程不能因为中断游戏。...成本节约 服务器空闲导致的成本,如以下这些情况: · 每日&周末&节假日的高峰波谷 · 游戏稳定运营及下降期,服务器空闲资源 · 活动期间,爆发增长,活动过后需资源空闲 比起游戏运营成本来说,服务器成本算不了什么...游戏服务器引擎(Game Server Engine,缩写GSE)提供专用游戏服务器托管服务,支持有状态的游戏服务部署和,实现服务发现、高效灵活的服务器伸缩和就近调度的能力,帮助开发者快速构建稳定...不需要提前在多个区域部署相同数量的服务器,从而达到0成本灾的效果。 9.png 4. GSE和普通弹性伸缩的区别——GSE专注于有状态场景 游戏中有两个特殊需求:断线重连、游戏中不能退出。

9.7K339

左手 VM,右手 Container Serverless,达达智能弹性伸缩架构和实践

嘉宾|杨森 编辑|李忠良 面对节假日常规促销、618/ 11 购物节等配送业务订单量的暴增,达达集团通过智能弹性伸缩架构和精细化的容量管理,有效地做到了业务系统对配送全链路履约和服务体验的保驾护航。...去年达达快送共有 11 亿的包裹量,每天有数十万的骑士来配送,配送范围覆盖全国 2700 个城市,单日峰值大概近千万。 1架构设计——故障驱动 达达决定做弹性,是由故障引发的。...5架构演练——弹性演练 弹性系统需要保证全自动运行,所以我们会定期做一些弹性演练。接下来与大家分享时候遇到的一些问题。...第一,当你的时候,肯定不是只有几个服务,可能是批量地进行,然后去验证上下游扩容的系统是否 OK。这其中的问题是——你有没有足够的钱影响到限额?...最后展望未来,这个系统是在 2019 年开发的,目前已经稳定运行了 20 多个月,有将近 18000 次的记录。整个系统也对接了多种云原生,包括全程全自动的,当然也做到了云的支持。

1K10
您找到你想要的搜索结果了吗?
是的
没有找到

最佳案例 | 日 PV 超百亿级的游戏营销服务云原生容器化之路

活动之间相互割裂,缺乏沉淀复用和共享 运营活动快上快下的特点非常适合跑在 TKE 环境,利用其弹性伸缩、快速特性应对活动突发流量。...自动,极大的提升了周期性游戏活动资源准备效率。...网关运营监控指标 业务容器性能监控指标 官网营销活动 官网营销活动HPA实践 业务需求场景:营销活动有定点开启特性,开启时流量会突增,且生命周期内流量波动较大,对资源有弹性需求。...需求 最终效果 分钟级扩容 优化后的 HPA 直接从 Metrics Server 取负载数据,扩容可以做到1分钟左右 原生 HPA 仅支持 Pod 粒度的 metric 计算,需要针对业务容器进行...container 时业务容器负载高,但是 Pod 整体负载低情况下可以扩容 支持 request、limit 多种方式触发 HPA 支持按 request、limit 的方式 HPA,覆盖不同的业务场景 事件

1.1K30

英雄联盟自动化利器

自动化的目的主要有三个部分,首先是用户体验的保障,我们必须以最快的响应速度去应对用户增长的需求,否则必然会出现大规模的掉线或者拥挤排队,影响游戏基本体验;其次是资源的最有效利用,英雄联盟业务的单位运营成本...关于自动化利器的用户交互,主要用的是类似汽车的仪表盘的形式来展示相关时实施人员比较关心的数据。如图(2) ?...所向披靡-无所不能的容量云: 二期功能加入了监控和自动触发、等功能,真正实现采集性能数据、按照模型分析出结论、实施、性能数据达标等一系列操作,流程上把容量管理这件事做成闭环。...自动采集数据、分析出决策、实施操作的整体流程架构图如下: ?...才将云中的服务器扩到游戏大区中;如红色的箭头所示,通过自动化的,我们做到了自动化的将游戏大区中,尚且富余的服务器资源返还给业务云,然后由云在分配给需要使用的游戏大区,这样通过自动化的服务,我们做到了服务器资源自动化的动态调用

1.9K100

黄宇:腾讯计费——亿万级大促活动自动化保障体系

3.现网变更频繁,前端版本、后端版本发布,系统配置调整、营销活动规则调整等各种变更每天加起来平均300+次,大家都知道,变更带来的故障通常占到了现网故障的75%以上,所以在这么变更频发的平台上进行营销活动资源...在这里的自动化设计里,现网大盘由服务组成,服务由系统实例组成,而实例承载的基础是腾讯计费自研的TDF程序框架;的核心大脑就是TSM自动化管理平台,压测平台周期性压测现网容量,现网内存、负载、...这里采用KVM虚拟机构建用于自动的资源池,共享资源池会在日常扩容中出库消耗,在中退库,这样持续的循环。...以上介绍了自动化决策和自动化的机制,那么是不是有了这些自动化机制就万无一失了呢?...一是大盘容量的压测机制,二是快速机制,以及资源共享管理、变更扫描,和限频保护措施。 构建之后,自动化保障体系可以浓缩为如下示意图。

2.4K30

腾讯计费:亿万级大促活动自动化保障体系

3.现网变更频繁,前端版本、后端版本发布,系统配置调整、营销活动规则调整等各种变更每天加起来平均350+次,大家都知道,变更带来的故障通常占到了现网故障的75%以上,所以在这么变更频发的平台上进行营销活动资源...在这里的自动化设计里,现网大盘由服务组成,服务由系统实例组成,而实例承载的基础是腾讯计费自研的TDF程序框架;的核心大脑就是TSM自动化管理平台,压测平台周期性压测现网容量,现网内存、负载、...这里采用KVM虚拟机构建用于自动的资源池,共享资源池会在日常扩容中出库消耗,在中退库,这样持续的循环。...如何确保变更精准无误 一开始有提到,在日常频繁变更的现网大盘上进行操作,故障风险是非常高的,那么怎么确保这里的变更准确性呢?也就是怎么确保扩容上去的资源服务没有问题。...如何防止大盘雪崩风险 以上介绍了自动化决策和自动化的机制,那么是不是有了这些自动化机制就万无一失了呢?

2.8K30

50W+ 小程序开发者背后的数据库降本增效实践

TDSQL-C Serverless 的技术实现   传统云数据库并没有实现自动、按使用量计费、无使用无费用。...在现实里,如果游戏厅就在你房间旁边,你房租的价格也会比其他地方的更贵。 计算跟存储分离,就是让房子和客厅解耦。只要解决传送问题(自动)就可以让这个房间的成本回归到它本身的价值。...常见的自动业务场景   慢查询。...当然你也可以选择在活动前扩容,活动。但这总的也不方便,而且并不是所有的活动都有足够的时间去规划。所以这时候就需要一个自动的能力。 定时任务。很多业务都会有定时任务的需求。...虽然你也可以根据计划去手动。但有些计划使用的计算资源不可控,时间也不可控。少了速度慢,可能还会影响到线上业务,多了又会浪费。

1.1K30

50W+小程序开发者背后的数据库降本增效实践

在现实里,如果游戏厅就在你房间旁边,你房租的价格也会比其他地方的更贵。 计算跟存储分离,就是让房子和客厅解耦。只要解决传送问题(自动)就可以让这个房间的成本回归到它本身的价值。...TDSQL-C Serverless 数据库特点 自动 按使用量计费 无使用无费用 我们希望你想要请求的时候,这个水资源能像瀑布一样倾泻而下,不需要业务提前感知。...当然你也可以选择在活动前扩容,活动。但这总的也不方便,而且并不是所有的活动都有足够的时间去规划。所以这时候就需要一个自动的能力。 定时任务 很多业务都会有定时任务的需求。...虽然你也可以根据计划去手动。但有些计划使用的计算资源不可控,时间也不可控。少了速度慢,可能还会影响到线上业务,多了话又是浪费。...用户数激增:自动。 小微项目:小规格实例 …… 目前我们做到了很多,未来我们还有很多可以去做。

1.3K10

OCGI:腾讯游戏应用的云原生实践

背景 对于FPS[2]、MOBA[3]等在线多人游戏后台架构中,都有专门服务玩家对局的服务器Dedicated Server(简称 DS)[4]。 下图是典型的游戏 DS 架构: ?...比如很多游戏业务都希望实现定时,甚至应用自己控制 Workload 副本数量。 业界已经有一些开源项目去尝试解决这类游戏服务的 DS 管理问题,比如 Google 的Agones[8]。 ?...Squad 和 GeneralPodAutoscaler 提供了一些扩展和交互机制,变更,或者时,GameServer 可以更加优雅的退出,避免对游戏玩家的影响。...应用定义顺序 时,可由应用指定的顺序。例如,时,应用可以选择玩家数量的 DS 副本删除。这不仅可以降低开销,还可以提高底层的资源利用效率。...更好的与集群(CA)工作 基于应用确认机制,时,CA 可以选择任意的副本进行删除,不用担心对用户的影响。 基于 OCGI 的游戏后台架构 ?

3.8K41

腾讯游戏打通 Apache Pulsar 与 Envoy,构建高效 OTO 营销平台

OTO 服务通过基于 Kubernetes 的 GDP(游戏微服务开发平台),可以快速部署、自动和资源回收复用。...再配合 K8s 的 HPA 即可自动根据后端性能指标,极大提升资源利用率。 Pulsar 还支持对单个消息独立 Ack,可以很好地防止重复消费。...这样所有服务都在云端通过 K8s 调度,有高可用保障,只需调整副本数即可轻松。 基于事件总线的事件分发 事件总线用于规范事件管理,事件按业务和类型维度管理。...K8s 支持 HPA,通过监控容器 CPU 和其他内存指标,当达到一定阈值时,触发服务。这对一些队列消费服务不适用。...我们计划扩展 K8s 的 HPA,在监控 CPU 和内存等指标基础上再监控 msgBacklog,增强灵活性,防止消息堆积。

72830

开源公告|微服务负载保护系统ModernFlux正式开源!

应用于腾讯IEG 80%的营销活动以及多个内部平台。经历各种秒杀活动游戏周年庆以及节假日,取得很好实践效果,保障了系统安全运营。现将ModernFlux对外开源,为微服务开源社区贡献力量。...数据传输具有容错机制,流控服务具有健壮性并有灾机制。 ...2.业务对负载保护系统无感知,即系统对业务透明。 3.在保证流控精度前提下,对业务流量(剧烈)变化不敏感,无需频繁。...应用场景有营销活动(如秒杀/周年庆),电商大促,多业务混布虚拟隔离。 大型游戏秒杀营销活动入口流量难以预估,由于流量瞬间暴增和营销资源有限,单纯堆砌资源成本高,也无必要,自动扩容往往也来不及。...ModernFlux应用效果 下图是部分ModernFlux应用于营销活动效果图,黄色线表示实际通过流量,黑色线表示被拒绝的流量,蓝色线表示上游的真实流量绿色表示整个Set流量控制(未触发): ?

75130

最佳案例 | 游戏知几 AI 助手的云原生容器化之路

通过云上的容器化部署、自动、健康检查、可观测性等手段,提高了知几项目的持续交付能力和稳定性,形成了一套适合游戏知几自身的上云实践方案。...,需要发布最新版本才能扩容; 依赖的权限(mysql 等)需要申请; 平台操作繁琐,容易出错; 需要人工完成运营活动后机器的操作。...基于上述的部署方案,利用云原生的自动能力可以方便地解决上述问题: STKE 提供的定时 HPA 和动态能力,可以很好的解决节假日、运营活动的流量突增带来的服务稳定性问题,且流量平稳后的自动可以有效的节约资源...由于 HPA 会导致业务容器的,如果流量在服务未完成启动时接入或者流量还在访问时接销毁 pod,会导致流量的损失,因此需要开启就绪检测和 prestop 配置。...特别是定时 HPA,可以很方便的满足知几在未成年人保护方面对的要求,系统可以在特定时间段完成系统容量的扩容和,在保证系统平稳应对流量的同时也不会造成对资源的浪费。

1.3K20

【腾讯云 TDSQL-C Serverless 产品体验】饮水机式使用云数据库

自动驾驶(Autopilot):数据库根据业务负载自动启动停止,无感过程不会断开连接。...以11高负载的场景为例,提前发起的操作会导致运维效益随之大打折扣。不仅如此,固定规格对传统云数据库的计算进程常驻,无请求时仍然收费。...3.秒级能力。(1). 通过计算与存储解耦,存储空间可以自动,弹性能力显著。(2). 存储容量可以自动扩充,且容量足够大,足以支撑业务的发展。4.秒级快照备份回档能力。(1)....随着业务的增长,能够进行水平扩容,的整体响应好。...自动:不需要开发者提前去预测扩容的实例规格,通过系统的负载来进行自动的扩容。购买的时候,给用户提供一个区间,比如选择的是1核2G, 2核4G,就会只在这个固定的区间范围内进行

13.8K1660

从0到3000万,TA们用云开发这样做

按量计费,自动 那么,为什么使用云开发的成本能降到这么低呢?团队一致认为应该归功于云开发的自动。 在接触云开发之前,服务器费用对于一家初创企业来说一直是一项大支出。...,而云开发的按量付费和自动机制就完美地解决了初创企业的服务器成本问题”。...这时,小程序云开发的云函数自动扩容机制就发挥作用了,快速反应扩容来应对大流量,让这次推广活动顺利完成,活动结束后,访问量也逐步恢复平日水平,这时候自动机制又开始启动了,关闭闲置的云函数资源,减少服务器成本...另外,为了保证“11·11活动的平稳运行,团队做了双重保障,一是提交工单,请云开发团队的工程师提前预热云函数,另一方面是将活动的时间拉长,尽可能把流量分摊开,不集中在某个时间点。...在此基础上,“11·11活动中业务小程序运行得非常稳定,平台的商品也纷纷售罄。

49830

像管理 Pod 一样管理 Node | TKE 节点池全面上线

自动化 节点池自动依赖 Cluster Autoscaler 实现, 可与 HPA 无缝联动,实现从应用到集群的平滑过渡。...节点池能够在容器不够资源分配的情况下按需扩容 能够监控节点的 CPU、内存,自动闲置节点 节点池提供两种模式供您按需选择。...您可追踪节点池关联的活动活动相关的触发条件、时间、涉及实例、成功/失败原因),同时您还可以通过事件持久化能力查看 Cluster Autoscaler 相关的集群级别记录。...易用性 节点池提供多种以及节点管理相关的灵活配置,您可以根据业务性质以及安全考虑自行搭配使用。 支持为节点设置保护 您可以标记重要业务节点,标记后节点不会在时被释放。...支持灵活的参数配置 您可以配置灵活的参数,本文将在下一节-原理中详细展开。 集群原理 弹性扩容原理 ?

1K40

干货 | 携程Redis治理演进之路(二)

方面,我们主要通过垂直的方式解决Redis集群容量的问题,但随着集群规模扩大,这种方式逐渐遇到了瓶颈。...垂直对于Redis来说只是Maxmemory的配置更改,对业务透明; 第二,水平拆分/的实现难度和成本较高。...三、Redis水平 3.1 设计思路 ? 图4 既然分片比较困难,我们首先想到的是业务写集群的方法,也就是业务同时写2个新老集群,新老集群的分片数是不一样的,并且大小配置也不一样。...借鉴业务写集群的思路和云原生的不可变基础设施的理念,我们首先想到的是通过新集群替换老集群而不是原地修改集群;另外,为了在公有云上节省Redis成本,我们积累了kvrocks的实践经验,两者相结合,设计了一种高效的水平的方案...根据实际的运维数据来看,集群单个实例为20G,集群在10分钟之内完成,而低于10G的,5分钟即可完成,大大缩短了的周期,并且业务在毫无感知的情况下即可完成

1K10

腾讯云上业务弹性实践案例

,导致本次活动产生不小的业务损失。...环境说明环境模拟说明,这里采用云产品资源规格如下:服务器规格:标准型S5.MEDIUM2云数据库: MySQL8.0,通用型-1核 2G,节点负载均衡: 公网CLB弹性伸缩:启动配置选择S5.MEDIUM2...配置告警触发策略这里为了快速看到效果,配置弹性扩容策略,CPU利用率设置为1分钟图片配置告警触发策略,弹性图片3. 验证3.1....图片3.2 弹性验证在进行压测的过程中, 可以在“伸缩活动”可以查看到,弹性策略如期生效,能进行自动弹性扩容、。图片4....总结本篇结合案例的痛点采用云产品进行业务弹性的改造,解决了在业务突增弹性扩容时效问题、低峰资源节省成本的问题,同时结合多云产品的弹性业务构建方法,让用户更容易上手与参考。5.

28940

腾讯云专家揭秘国内首款无服务器数据库架构

不久前,腾讯云发布了国内第一款无服务器数据库ServerlessDB,受到众多数据库开发者的关注,关于该数据库的自动能力以及背后的设计原理展开了激烈的探讨。...PartⅠ 真正实现自动的挑战 相比较于传统数据库,云数据库的弹性和按量计费能够帮助用户按需使用云资源,避免资源浪费的同时大幅节省了成本。...当用户访问请求上涨时,数据库针对用户请求的特点使用不同的系统资源,而这些资源需要动态的响应,且不会受到服务器限制。不同资源的粒度需要小到一个数据块——CPU核心。...腾讯云ServerlessDB采用租户隔离以及连接池管理技术,从而实现了技术层面上真正的弹性。 1....快速能力 在租户隔离技术避免了不同租户之间的访问越界问题后,在方面,ServerlessDB是如何保证对用户进行细粒度控制的呢?

4.6K50

虚拟节点轻松应对 LOL S11 百万并发流量——腾竞体育的弹性容器实践

业务初期:手动扩容 业务初期,负载较低,根据业务特征,手动基本可以满足需求。 由于手动需要一定的时间窗口,因此需要放置一定数量的冗余资源应对突增流量,资源利用率较低,只有6%左右。...业务发展中:节点池 随着业务发展,周期性的高低峰流量特征愈发明显,面对高频的需求时,手动不仅人力成本较高,而且无法避免人为失误。...在突增流量速度较慢的场景下,节点池可以较好满足业务需求,不过需配置服务器,扩容速度较慢,冗余资源仍存在,资源利用率较低。另外,时对节点进行封锁、驱逐等操作,不利于服务的稳定性。...相比节点池,虚拟节点的扩容、流程简化了购买、初始化、退还服务器的流程,大大提升了弹性的速度,尽可能降低在扩容流程中可能出现的失败,使得弹性更快、更高效、更节省成本。...秒级 通过虚拟节点+K8s HPA 能力,集群可在数十秒内启动数以百计的承载百万级流量的Pod,可以轻松应对快速需求。再结合业务侧数据,自动化进行资源预热,提升集群抗突增流量能力。

1K20

入门学云原生系列01——云原生是什么?

简单认识 云原生有一个简单的理解:云指的就是云服务器,原生指的就是云服务器中自带的应用软件。...这些应用软件可以高效弹性(指的就是增加或减少服务器的数量)后,自动适配新的服务器数量环境,而不需要运维或开发做什么。...那么11的到来了,这些服务器肯定不够用,那么怎么安排才能满足11的需求呢?...那么可以把11活动分解成: 活动前:11前引导用户浏览商品,并把商品添加到购物车 活动中:11开始,引导用户直接从购物车下单购买 按照上述分解之后,活动前的访问压力就集中到商品浏览、商品购物车模块...反之活动中,购物车和支付模块的压力变大,我们可以同样把商品浏览模块的一半服务器分配给购物车和支付模块使用。通过以上的合理调配,你会发现我们没有增加新服务器,也能应对高并发。

5.1K31
领券