首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何快速构建稳定、低延时的多人游戏的部署环境?

腾讯游戏服务器引擎(Game Server Engine,缩写GSE),支持有状态的游戏服务部署和,实现服务发现、高效灵活的服务器伸缩和就近调度的能力,帮助开发者快速构建稳定、低延时的多人游戏的部署环境...这是一个有状态的场景:对于游戏服务,尤其是对战服务来说,不能是简单添加一个clb(负载均衡)就能搞定。在游戏服务里需要断线重连,能找到之前连接的服务器;另外游戏过程不能因为中断游戏。...成本节约 服务器空闲导致的成本,如以下这些情况: · 每日&周末&节假日的高峰波谷 · 游戏稳定运营及下降期,服务器空闲资源 · 活动期间,爆发增长,活动过后需资源空闲 比起游戏运营成本来说,服务器成本算不了什么...游戏服务器引擎(Game Server Engine,缩写GSE)提供专用游戏服务器托管服务,支持有状态的游戏服务部署和,实现服务发现、高效灵活的服务器伸缩和就近调度的能力,帮助开发者快速构建稳定...不需要提前在多个区域部署相同数量的服务器,从而达到0成本灾的效果。 9.png 4. GSE和普通弹性伸缩的区别——GSE专注于有状态场景 游戏中有两个特殊需求:断线重连、游戏中不能退出。

9.9K339

最佳案例 | 日 PV 超百亿级的游戏营销服务云原生容器化之路

活动之间相互割裂,缺乏沉淀复用和共享 运营活动快上快下的特点非常适合跑在 TKE 环境,利用其弹性伸缩、快速特性应对活动突发流量。...自动,极大的提升了周期性游戏活动资源准备效率。...网关运营监控指标 业务容器性能监控指标 官网营销活动 官网营销活动HPA实践 业务需求场景:营销活动有定点开启特性,开启时流量会突增,且生命周期内流量波动较大,对资源有弹性需求。...需求 最终效果 分钟级扩容 优化后的 HPA 直接从 Metrics Server 取负载数据,扩容可以做到1分钟左右 原生 HPA 仅支持 Pod 粒度的 metric 计算,需要针对业务容器进行...container 时业务容器负载高,但是 Pod 整体负载低情况下可以扩容 支持 request、limit 多种方式触发 HPA 支持按 request、limit 的方式 HPA,覆盖不同的业务场景 事件

1.2K30
您找到你想要的搜索结果了吗?
是的
没有找到

左手 VM,右手 Container Serverless,达达智能弹性伸缩架构和实践

嘉宾|杨森 编辑|李忠良 面对节假日常规促销、618/ 11 购物节等配送业务订单量的暴增,达达集团通过智能弹性伸缩架构和精细化的容量管理,有效地做到了业务系统对配送全链路履约和服务体验的保驾护航。...5架构演练——弹性演练 弹性系统需要保证全自动运行,所以我们会定期做一些弹性演练。接下来与大家分享时候遇到的一些问题。...第一,当你的时候,肯定不是只有几个服务,可能是批量地进行,然后去验证上下游扩容的系统是否 OK。这其中的问题是——你有没有足够的钱影响到限额?...达达极限的时间是晚上 10 点到早上 6 点之间,只保留两台机器;早上 6:00~10:00 之间,它的最小数是 12 台机器,因此晚上可以降低一定的成本。...最后展望未来,这个系统是在 2019 年开发的,目前已经稳定运行了 20 多个月,有将近 18000 次的记录。整个系统也对接了多种云原生,包括全程全自动的,当然也做到了云的支持。

1.1K10

干货 | 携程Redis治理演进之路(二)

方面,我们主要通过垂直的方式解决Redis集群容量的问题,但随着集群规模扩大,这种方式逐渐遇到了瓶颈。...垂直对于Redis来说只是Maxmemory的配置更改,对业务透明; 第二,水平拆分/的实现难度和成本较高。...三、Redis水平 3.1 设计思路 ? 图4 既然分片比较困难,我们首先想到的是业务写集群的方法,也就是业务同时写2个新老集群,新老集群的分片数是不一样的,并且大小配置也不一样。...借鉴业务写集群的思路和云原生的不可变基础设施的理念,我们首先想到的是通过新集群替换老集群而不是原地修改集群;另外,为了在公有云上节省Redis成本,我们积累了kvrocks的实践经验,两者相结合,设计了一种高效的水平的方案...根据实际的运维数据来看,集群单个实例为20G,集群在10分钟之内完成,而低于10G的,5分钟即可完成,大大缩短了的周期,并且业务在毫无感知的情况下即可完成

1.1K10

最佳案例 | 游戏知几 AI 助手的云原生容器化之路

通过云上的容器化部署、自动、健康检查、可观测性等手段,提高了知几项目的持续交付能力和稳定性,形成了一套适合游戏知几自身的上云实践方案。...,需要发布最新版本才能扩容; 依赖的权限(mysql 等)需要申请; 平台操作繁琐,容易出错; 需要人工完成运营活动后机器的操作。...基于上述的部署方案,利用云原生的自动能力可以方便地解决上述问题: STKE 提供的定时 HPA 和动态能力,可以很好的解决节假日、运营活动的流量突增带来的服务稳定性问题,且流量平稳后的自动可以有效的节约资源...由于 HPA 会导致业务容器的,如果流量在服务未完成启动时接入或者流量还在访问时接销毁 pod,会导致流量的损失,因此需要开启就绪检测和 prestop 配置。...特别是定时 HPA,可以很方便的满足知几在未成年人保护方面对的要求,系统可以在特定时间段完成系统容量的扩容和,在保证系统平稳应对流量的同时也不会造成对资源的浪费。

1.4K20

英雄联盟自动化利器

自动化的目的主要有三个部分,首先是用户体验的保障,我们必须以最快的响应速度去应对用户增长的需求,否则必然会出现大规模的掉线或者拥挤排队,影响游戏基本体验;其次是资源的最有效利用,英雄联盟业务的单位运营成本...关于自动化利器的用户交互,主要用的是类似汽车的仪表盘的形式来展示相关时实施人员比较关心的数据。如图(2) ?...所向披靡-无所不能的容量云: 二期功能加入了监控和自动触发、等功能,真正实现采集性能数据、按照模型分析出结论、实施、性能数据达标等一系列操作,流程上把容量管理这件事做成闭环。...自动采集数据、分析出决策、实施操作的整体流程架构图如下: ?...才将云中的服务器扩到游戏大区中;如红色的箭头所示,通过自动化的,我们做到了自动化的将游戏大区中,尚且富余的服务器资源返还给业务云,然后由云在分配给需要使用的游戏大区,这样通过自动化的服务,我们做到了服务器资源自动化的动态调用

1.9K100

黄宇:腾讯计费——亿万级大促活动自动化保障体系

3.现网变更频繁,前端版本、后端版本发布,系统配置调整、营销活动规则调整等各种变更每天加起来平均300+次,大家都知道,变更带来的故障通常占到了现网故障的75%以上,所以在这么变更频发的平台上进行营销活动资源...在这里的自动化设计里,现网大盘由服务组成,服务由系统实例组成,而实例承载的基础是腾讯计费自研的TDF程序框架;的核心大脑就是TSM自动化管理平台,压测平台周期性压测现网容量,现网内存、负载、...这里采用KVM虚拟机构建用于自动的资源池,共享资源池会在日常扩容中出库消耗,在中退库,这样持续的循环。...以上介绍了自动化决策和自动化的机制,那么是不是有了这些自动化机制就万无一失了呢?...一是大盘容量的压测机制,二是快速机制,以及资源共享管理、变更扫描,和限频保护措施。 构建之后,自动化保障体系可以浓缩为如下示意图。

2.5K30

腾讯计费:亿万级大促活动自动化保障体系

3.现网变更频繁,前端版本、后端版本发布,系统配置调整、营销活动规则调整等各种变更每天加起来平均350+次,大家都知道,变更带来的故障通常占到了现网故障的75%以上,所以在这么变更频发的平台上进行营销活动资源...在这里的自动化设计里,现网大盘由服务组成,服务由系统实例组成,而实例承载的基础是腾讯计费自研的TDF程序框架;的核心大脑就是TSM自动化管理平台,压测平台周期性压测现网容量,现网内存、负载、...这里采用KVM虚拟机构建用于自动的资源池,共享资源池会在日常扩容中出库消耗,在中退库,这样持续的循环。...如何确保变更精准无误 一开始有提到,在日常频繁变更的现网大盘上进行操作,故障风险是非常高的,那么怎么确保这里的变更准确性呢?也就是怎么确保扩容上去的资源服务没有问题。...如何防止大盘雪崩风险 以上介绍了自动化决策和自动化的机制,那么是不是有了这些自动化机制就万无一失了呢?

2.8K30

50W+ 小程序开发者背后的数据库降本增效实践

TDSQL-C Serverless 的技术实现   传统云数据库并没有实现自动、按使用量计费、无使用无费用。...在现实里,如果游戏厅就在你房间旁边,你房租的价格也会比其他地方的更贵。 计算跟存储分离,就是让房子和客厅解耦。只要解决传送问题(自动)就可以让这个房间的成本回归到它本身的价值。...常见的自动业务场景   慢查询。...当然你也可以选择在活动前扩容,活动。但这总的也不方便,而且并不是所有的活动都有足够的时间去规划。所以这时候就需要一个自动的能力。 定时任务。很多业务都会有定时任务的需求。...虽然你也可以根据计划去手动。但有些计划使用的计算资源不可控,时间也不可控。少了速度慢,可能还会影响到线上业务,多了又会浪费。

1.1K30

50W+小程序开发者背后的数据库降本增效实践

在现实里,如果游戏厅就在你房间旁边,你房租的价格也会比其他地方的更贵。 计算跟存储分离,就是让房子和客厅解耦。只要解决传送问题(自动)就可以让这个房间的成本回归到它本身的价值。...TDSQL-C Serverless 数据库特点 自动 按使用量计费 无使用无费用 我们希望你想要请求的时候,这个水资源能像瀑布一样倾泻而下,不需要业务提前感知。...当然你也可以选择在活动前扩容,活动。但这总的也不方便,而且并不是所有的活动都有足够的时间去规划。所以这时候就需要一个自动的能力。 定时任务 很多业务都会有定时任务的需求。...虽然你也可以根据计划去手动。但有些计划使用的计算资源不可控,时间也不可控。少了速度慢,可能还会影响到线上业务,多了话又是浪费。...用户数激增:自动。 小微项目:小规格实例 …… 目前我们做到了很多,未来我们还有很多可以去做。

1.3K10

OCGI:腾讯游戏应用的云原生实践

背景 对于FPS[2]、MOBA[3]等在线多人游戏后台架构中,都有专门服务玩家对局的服务器Dedicated Server(简称 DS)[4]。 下图是典型的游戏 DS 架构: ?...比如很多游戏业务都希望实现定时,甚至应用自己控制 Workload 副本数量。 业界已经有一些开源项目去尝试解决这类游戏服务的 DS 管理问题,比如 Google 的Agones[8]。 ?...Squad 和 GeneralPodAutoscaler 提供了一些扩展和交互机制,变更,或者时,GameServer 可以更加优雅的退出,避免对游戏玩家的影响。...应用定义顺序 时,可由应用指定的顺序。例如,时,应用可以选择玩家数量的 DS 副本删除。这不仅可以降低开销,还可以提高底层的资源利用效率。...更好的与集群(CA)工作 基于应用确认机制,时,CA 可以选择任意的副本进行删除,不用担心对用户的影响。 基于 OCGI 的游戏后台架构 ?

3.9K41

腾讯游戏打通 Apache Pulsar 与 Envoy,构建高效 OTO 营销平台

OTO 服务通过基于 Kubernetes 的 GDP(游戏微服务开发平台),可以快速部署、自动和资源回收复用。...再配合 K8s 的 HPA 即可自动根据后端性能指标,极大提升资源利用率。 Pulsar 还支持对单个消息独立 Ack,可以很好地防止重复消费。...这样所有服务都在云端通过 K8s 调度,有高可用保障,只需调整副本数即可轻松。 基于事件总线的事件分发 事件总线用于规范事件管理,事件按业务和类型维度管理。...K8s 支持 HPA,通过监控容器 CPU 和其他内存指标,当达到一定阈值时,触发服务。这对一些队列消费服务不适用。...我们计划扩展 K8s 的 HPA,在监控 CPU 和内存等指标基础上再监控 msgBacklog,增强灵活性,防止消息堆积。

77930

开源公告|微服务负载保护系统ModernFlux正式开源!

应用于腾讯IEG 80%的营销活动以及多个内部平台。经历各种秒杀活动游戏周年庆以及节假日,取得很好实践效果,保障了系统安全运营。现将ModernFlux对外开源,为微服务开源社区贡献力量。...数据传输具有容错机制,流控服务具有健壮性并有灾机制。 ...2.业务对负载保护系统无感知,即系统对业务透明。 3.在保证流控精度前提下,对业务流量(剧烈)变化不敏感,无需频繁。...应用场景有营销活动(如秒杀/周年庆),电商大促,多业务混布虚拟隔离。 大型游戏秒杀营销活动入口流量难以预估,由于流量瞬间暴增和营销资源有限,单纯堆砌资源成本高,也无必要,自动扩容往往也来不及。...ModernFlux应用效果 下图是部分ModernFlux应用于营销活动效果图,黄色线表示实际通过流量,黑色线表示被拒绝的流量,蓝色线表示上游的真实流量绿色表示整个Set流量控制(未触发): ?

78030

腾讯云专家揭秘国内首款无服务器数据库架构

不久前,腾讯云发布了国内第一款无服务器数据库ServerlessDB,受到众多数据库开发者的关注,关于该数据库的自动能力以及背后的设计原理展开了激烈的探讨。...PartⅠ 真正实现自动的挑战 相比较于传统数据库,云数据库的弹性和按量计费能够帮助用户按需使用云资源,避免资源浪费的同时大幅节省了成本。...当用户访问请求上涨时,数据库针对用户请求的特点使用不同的系统资源,而这些资源需要动态的响应,且不会受到服务器限制。不同资源的粒度需要小到一个数据块——CPU核心。...腾讯云ServerlessDB采用租户隔离以及连接池管理技术,从而实现了技术层面上真正的弹性。 1....快速能力 在租户隔离技术避免了不同租户之间的访问越界问题后,在方面,ServerlessDB是如何保证对用户进行细粒度控制的呢?

4.7K50

像管理 Pod 一样管理 Node | TKE 节点池全面上线

自动化 节点池自动依赖 Cluster Autoscaler 实现, 可与 HPA 无缝联动,实现从应用到集群的平滑过渡。...节点池能够在容器不够资源分配的情况下按需扩容 能够监控节点的 CPU、内存,自动闲置节点 节点池提供两种模式供您按需选择。...您可追踪节点池关联的活动活动相关的触发条件、时间、涉及实例、成功/失败原因),同时您还可以通过事件持久化能力查看 Cluster Autoscaler 相关的集群级别记录。...易用性 节点池提供多种以及节点管理相关的灵活配置,您可以根据业务性质以及安全考虑自行搭配使用。 支持为节点设置保护 您可以标记重要业务节点,标记后节点不会在时被释放。...支持灵活的参数配置 您可以配置灵活的参数,本文将在下一节-原理中详细展开。 集群原理 弹性扩容原理 ?

1.1K40

【腾讯云 TDSQL-C Serverless 产品体验】饮水机式使用云数据库

自动驾驶(Autopilot):数据库根据业务负载自动启动停止,无感过程不会断开连接。...以11高负载的场景为例,提前发起的操作会导致运维效益随之大打折扣。不仅如此,固定规格对传统云数据库的计算进程常驻,无请求时仍然收费。...3.秒级能力。(1). 通过计算与存储解耦,存储空间可以自动,弹性能力显著。(2). 存储容量可以自动扩充,且容量足够大,足以支撑业务的发展。4.秒级快照备份回档能力。(1)....随着业务的增长,能够进行水平扩容,的整体响应好。...自动:不需要开发者提前去预测扩容的实例规格,通过系统的负载来进行自动的扩容。购买的时候,给用户提供一个区间,比如选择的是1核2G, 2核4G,就会只在这个固定的区间范围内进行

13.9K1660

全面讲解如何快速开发腾讯云小游戏

该平台做了很多简单的整改,我们发现很多开发者其实对购买服务器搭建数据库、初始化、等,并不熟悉,包括CDN他们也不太明白。...前面的轻量级游戏解决方案无法适用于重度游戏,所以我们总结了些重度小游戏在架构方面面临的一些挑战。 首先是弹性,这也是目前最令运维最头痛的问题,因为我们无法预测到小程序何时会爆。...有时候某个大V不经意的在朋友圈或者群里发了这个游戏,可能就会引发几何式的增长。 而此时游戏又没有办法做弹性扩容,因为可能架构上就不满足弹性的要求。...所以我们经常会看到,要么游戏一直不火,要么火了一段时间后停机维护,之后淡出视线。 第二个是高并发承载,这也是实现弹性的先决条件,即如何应对突发的大流量涌入,在高压情况下保证游戏的流畅性。...弹性扩容主要是通过腾讯云的云监控获取服务器、CPU、内存、读写的承载情况,然后判断这些数据是否达到阈值,一旦超过阈值就自动进行

3.6K40

Serverless 开发实战之Nodejs:三分钟快速定制你的新冠病毒疫情信息查询网页

,但很多人误认为serverless只是计算的演进,但其实Serverless不单指计算,一般来说Serverless = FaaS + BaaS,既有计算能力的提供,也由后端能力的提供,泛指可以弹性...典型的Serverless服务的例子: 云函数 Cloud Function API ⽹关 API Gateway 对象存储 Object Storage 都支持弹性、按需付费。...弹性,轻松应对突增流量。使得资源利用率得到提升。 关注业务代码,减少运维复杂度。这使得开发者的效率得到提高。...右下角的图,展示了在传统的模式下,搭建企业级架构是需要考虑很多方面的,如运维数据库、分配服务器、集群、安全、网络等。对于开发者而言,这很多是没必要的,只需关注自身的业务逻辑。...客户⽅案: 所有⽆状态的HTTP接⼝,⽐如客服消息接收、⽀付回调均迁移到 Serverless 架构上 ⽆需返回的异步任务,⽐如游戏⾥的上报玩家排名 定时任务,⽐如定期对玩家推送相应的活动信息 客户价值

43820

AutoScaling 目标追踪伸缩规则概述「建议收藏」

对于过程,这意味着过程的精度和效率无法协调。 调整过程缺乏控制。基于简单报警规则的动态调整策略,仅仅是将如何调整和何时调整这两个定义简单组合起来,缺乏有效的控制手段。...快速、精准、动态的。目标追踪伸缩规则增加了对监控数据的感知能力,根据历史的监控数据值和期望目标值计算出所需要的实例数,使用尽量少的调整过程趋近监控指标目标值。 实例预热。...当报警规则发生报警时,将触发对应的操作,弹性伸缩将根据监控指标的历史数据计算过程的实例个数。...例如,您可能会遇到作用于过程的报警规则一直处于报警状态,却没有活动发生的情况。这种情况主要是由于过程计算得到的实例数量少于一个,因此不会产生实际的伸缩活动。...任何修改都将导致拒绝执行对应的/活动,当您删除伸缩规则时,相应的报警规则会自动删除。

83620

带妹上分,团战五杀,光有技术可不行

另外,对于底层架构来说,相比较于其他类型业务,游戏业务除去常规的业务高峰时间预估之外,很难做到业务爆发的时间准确判断,作为国民手游的王者荣耀也存在因各类突发事件和特殊时期带来的巨大流量,这对底层数据库自动能力提出了巨大挑战...在这种访问模式下,游戏服务器操作平均响应时延小于4ms,存储层读写时延为微秒级。 ?...我们都知道,面对随时会出现的业务高峰和低谷,人力运维存在明显弊端,这就对系统的智能化能力提出了高要求,而高频的业务忽高忽低,导致伸和同时出现,会使得数据库无法处理请求,严重的还会导致数据库宕机,所以要实现系统智能根据业务情况进行自动是非常困难的...四、接入层是无损的,业务无感知 TcaplusDB自研了SDK,SDK内维护了接入层一致性hash环,天然支持增加或者减少接入层节点。...1 PartⅢ 结语 TcaplusDB是一款腾讯自研的高性能内存式分布式数据库系统,具有高性能、无损、高可用、易用性等特性,针对游戏业务的开发、运营需求,支持全区全服、分区分服的业务模式,提供不停服

1.6K60
领券