首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

混合云应用双活容灾最佳实践

业务存在多个产品线,依赖关系复杂、调用路长,且处于高速发展频繁迭代时期,期望容灾建设不会给业务研发团队带来改造负担。...改造后的应用部署架构 日常场景:IDC+云上同时承担业务流量--应用双活 访问电商 Demo 首页,查看实际流量调用:概率性的访问到北京或杭州单元,均读写北京单元的数据库。...说明: 演练前,基于 MSHA 流量监控或其他监控产品,确定业务稳态的监控指标(如日常情况 RT<=200ms,错误率<1%),以便在故障发生判断故障影响面以及在故障恢复后判断业务的实际恢复情况。...在流任务页面的当前状态显示流完成,表示流已成功。 刷新电商 Demo 首页,多次访问均能正常展示,符合预期。 查看实际流量调用:流量始终访问到杭州单元,读写北京单元的数据库。...7.4 数据库故障注入 从上面调用可以看出,杭州单元的应用仍然访问的是北京单元的 Redis、MySQL 数据库。

3K20
您找到你想要的搜索结果了吗?
是的
没有找到

单核QPS提升10倍,亿级日调用!QQ频道前端网关升级之路

一开始只是流量稍微上涨,不久来了 oncall: 十万火急(问题) 复制频道链接乱码(对应短服务); 频道邀请链接和一个无鉴权的分享接口(对应协议转换服务)调用飙升; 失败率的上升趋势肉眼可见;...短服务高负载,但是进程没挂,而且扩容没有让失败率略微下降! 这种表现,最可能什么原因? 某个服务链接数有限制,或者耗尽,而且最有可能是 MySQL。...STGW L5 缓存更新问题 在新增或更新 STGW 路由至 L5(旧公司级域名服务)后,出现了以下具体问题: 无法找到服务的 IP 地址; 部分请求找到了错误的 IP 地址; 这些问题都会导致请求超时...5.2 问题分析 应用日志上报的错误信息——如“pksey 无效”或“tRPC 调用超时”——在正常情况下也会偶尔出现,但这次它们的频率异常增高。...我熟悉前端最习惯的调用方式: 想要不更换 URL 就能测试环境; 想要不改 cookie 也能环境; 想要一致的返回结构; 想要固定的传参方式; 不要操作 cookie、操作票据、重复传一大堆不想关心的数据

43411

单元化架构在金融行业的最佳实践

另外,在异地多机房情况下,服务间调用路可能会在本机房和跨机房中随机选择,这样也提高了调用路的不稳定性。...单元化架构通过“单元”,将逻辑调用和数据访问在“单元”形成闭环,只有少数特定场景的调用会跨单元访问,这样几乎大部分的请求在地域就可以返回,极大程度地减少了访问耗时,避免了跨异地访问路拥堵造成的服务夯死...TSF的单元化能力 TSF支持使用单元化功能以达到让不同的业务流量根据一定的单元化规则分发到指定的单元里,不同单元之间通过微服务网关实现跨单元调用,当某个单元的服务器实例出现问题也不会影响到其他单元业务的使用...业务南北向流量应尽早完成正确单元的路由寻址,出现单元错误时可正常重定向。 当出现单元化路由KEY不符合任何单元或访问不携带KEY,可报错或按默认单元化规则处理。...针对正常/错误的单元化调用流向,做到可监控、可预警、可管理。 4. 调用说明 如上图所示,以银行转账为例,说明TSF单元化三类服务调用顺序。 红:代表单元内调用

4.4K32

接口测试平台代码实现105:登录态接口

也就是说,带着用户名 密码 /验证 的那个接口,它作为第一个接口,是很特殊的,它不像后续接口需要token,它是用来获取token的,然后这个token被客户端当作其他后续接口的请求体/header中...而token是会变的,每当登陆接口调用了一次,token都会变化一次。...,然后客户端接收到这个错误码就会把用户踢出。...不过话说回来,这一都是要靠第一个请求,登陆接口来搞定。 所以我们测试平台为什么要加入这个功能呢?...然后在登录态按钮和这个login_show函数结合起来: 到此,我们点击按钮 打开登陆态接口的设置层的路就完成了。下一节我们要开发这个div的具体各个元素了。

78130

8分钟丨教你玩转 API

异常告警 若API服务出现异常,API平台会主动通知接口使用方与提供方。 异常告警案例 CMDB下发配置(16:30,17:30灰度),未走流量,导致接口请求小部分异常。...应用后-路分析场景: API平台调用路分析能力,方便不懂业务的运维同学,一键在线查看整个调用,直达问题根节点: 1.获取异常请求ID: 前端页面或后台服务出现异常,定位者可以从页面或日志中获取调用请求的...ID, 2.还原问题现场: 根据请求ID,在API平台获取调用,快速全方位的还原现场数据:路中每个请求的入参,出参,耗时,返回,异常日志等。...API调用路分析 API平台根据起始请求,将接口间调用关系生成一棵调用树.我们可以一目了然的看到: 1.请求的调用路; 2.每一层调用现场:服务调用方,服务提供方,接口返回,耗时, 入参...结论二:通过调用,发现工具市场存在重复调用cmdb接口问题。工具市场下个迭代修复。 案例二:CMDB异常 (1)问题现场:执行工具市场,只提示CMDB异常。但不知道原因。

81230

Skywalking微服务监控分析

服务之间的相互调用过程中,如果业务出现错误或者异常,如何快速定位问题?如何跟踪业务调用路?如何分析解决业务瓶颈?...本文我们来看看如何解决以上问题。...二、业务调用路监控 Service Topology监控 调用路监控可以从两个角度去看待。我们先从整体上来认识一下我们所监控的系统。...在每一条trace的信息中都可以看到当前请求的时间、GloableId、以及请求被调用的时间。我们分别看一看正确的调用和异常的调用。 Trace调用路监控 ?...这是一次正常的请求调用Trace日志,可能我们并不关心正常的时候,毕竟一正常不就是我们期待的么! 我们再来看下,异常状态下我们的Trace以及Span又是什么样的呢。 ?...发生错误调用中Span中的is error标识变为true,并且在名为Logs的TAB中可以看到错误发生的具体原因。

2.9K30

联盟智能合约安全浅析

和以太坊相比,Fabric和底层账本是分开的,升级并不需要迁移账本数据到新当中,真正实现了逻辑与数据的分离,同时,采用Go、Java、Nodejs语言编写。...数据流向 Fabric通过gprc与peer节点交互 (1)当peer节点收到客户端请求的输入(propsal)后,会通过发送一个消息对象(带输入信息,调用者信息)给对应的。...•除数为零 代码基本算数运算过程中,当出现除数为零的错误时,通常会导致程序崩溃和拒绝服务漏洞。 ?...当出现越界,由于无法得知被访问空间存储的内容,所以会产生不确定的行为,可能是程序崩溃、运算结果非预期。 ? ?...•异常处理问题 通常每个函数调用结束后会返回相应的返回参数,错误码,如果未认真检查错误码值而直接使用其返回参数,可能导致越界访问,空指针引用等安全隐患。

2.2K10

京东技术沙龙系列之二 | 深度解析京东微服务组件平台

京东分布式服务跟踪系统(CallGraph)秉承Google Dapper论文的先进理念,以业务“零”侵入的交付方式,提供跨网络的调用堆栈分析,使我们既能从宏观上俯瞰纷繁的业务关系及调用整体特质,又能从微观上观察和审视调用上各环节的细节...我们希望该进化过程可以促进更多、更好的组件出现,提高我们对外赋能的效率。 微服务平台将提供一系列的配套生态工具,来提高研发人员开发分布式应用的效率。...可以说认真贯彻DDD理论设计出来的微服务一定是“服务聚,服务间低耦合”的。...Q:从哪些方面考虑当前系统是否有必要为微服务实现,有哪些维度需要优先考量。微服务对比当前系统的优势。...微服务平台中的CallGraph系统秉承Google Dapper论文的先进理念,以业务“零”侵入的交付方式,提供跨网络的调用堆栈分析,使我们既能从宏观上俯瞰纷繁的业务关系及调用整体特质,又能从微观上观察和审视调用上各环节的细节

87640

监控产品上新月报【11月】

支持客户端采样,减少上报成本和路存储成本。 在访问量较大,全路数据上报可能会导致使用 APM 的成本较高。在访问量级较大的情况下,往往会进行数据采样,减少上报成本和路存储成本。 ...PS:应用性能观测采样规则以路为单位,假设一个 Span 符合异常路或慢调用规则时候,为保证路的完整性,将会保存这个 Span 对应的完整路。...系统规则为先匹配用户配置的自定义采样规则,不包含在自定义规则路,再匹配业务系统配置中的采样规则。...错误数过滤。 用于过滤错误数中所属错误状态。系统默认 HTTP 状态>400作为错误计数,您所填写的状态码数字将不会纳入错误数中。  C. URL 收敛。...在拓扑图中,用户可以查看上下游应用的请求量、平均延时和错误率,点击调用先可查看调用概览,丰富了应用间的调用分析功能。 [点击查看大图] 前端性能监控 RUM 1. 支持上报数据量告警。

63320

轻松玩转全路监控

3、当系统出现故障或异常的时候,如何第一间发现问题、定位问题、解决问题? 这3个关键诉求的核心挑战,都来源于应用之间复杂的路。...像 Java 这样的编程语言可以通过字节增强技术实现探针方式的路信息采集。...可观测性是一自动化决策的基础,求最终目的是为一个复杂分布式系统所发生的一给出合理解释。...图:应用拓扑 应用详情 在应用详情视图中,能够基于应用整体的维度以及应用单实例的维度查看更多详细的信息,包括JVM信息、主机信息、SQL调用分析、异常和错误分析等等。...从这个应用所有提供的接口中,我们可以选中需要分析的单个接口,与这个接口相关的路信息就能够从多个维度展示出来,其中包括接口的请求数、响应时间、错误数、返回状态,以及在接口所对应的路中,应用访问外部数据库

1.3K11

TSF微服务治理实战系列(二)——服务路由

当线上调用路较为复杂,全路灰度发布可以将生产环境隔离出一个逻辑独立的运行环境。同时,全路灰度的泳道可以反复使用,即使进行变动也比较灵活,使得全路灰度的运维成本也缩小很多。...那么在全路灰度发布,服务间调用如果使用了kafka做异步解耦,在消息未被染色就会出现Consumer错误的消费了其它泳道消息的现象,这是业务不能接受的。...4、基于本地缓存的单元路由规则进行服务寻址,实现单元路由调用。 注意事项 1、单元内服务调用尽量在单元闭环,减少跨单元调用。 2、如果业务需要跨单元调用,由微服务网关管理跨单元请求的转发。...3、业务南北向流量应尽早完成正确单元的路由寻址,出现单元寻址错误时需能够正常重定向。 4、当出现单元化路由KEY不符合任何单元或访问不携带KEY,可报错或按默认单元化规则处理。...5、针对正常/错误的单元化调用流向,做到可监控、可预警、可管理。 TSF单元化能力主要以 “微服务网关”+“命名空间”为实现基础。

1.1K10

天机阁——全路跟踪系统设计与实现

小时光茶社 传说中天机阁里有一台掌控世间一的机器,万物运行由此产生。本文的“天机阁”是一个基于路跟踪的监控系统,后台开发人员能够通过“天机阁”洞察“天机”,快速解决问题。...我们的出路 腾讯在路跟踪这块比较薄弱,需要尽快填补这个空白。以上几款路跟踪系统都各自满足了路追踪的功能,但落实到我们自己的生产环境中,这些Trace系统存在诸多问题。...Pinpoint和zipkin已经开源,然而pinpoint通过字节注入的方式实现调用拦截和数据收集,仅能用于java服务器,Zipkin没有C++的版本,并且功能不够用。...若未采样的rpc发生错误,需要从后往前逆向构造调用关系。 这种情况天机阁会帮父span生成一个id,并通过回包把父spanid传递给主调。主调据此来构造调用关系。...小时光茶社 长按识别左侧二维,关注我们涨姿势

6.8K50

前端二面必会面试题及答案_2023-03-15

5xx Server Error(服务器错误状态) 服务器处理请求出错 1. 2XX (Success 成功状态)状态2XX表示请求被正常处理了。...若用户把 URI 保存成书签,但不会像 301 状态出现时那样去更新书签,而是仍旧保留返回 302 状态的页面对应的 URI。同时,搜索引擎会抓取新的内容而保留旧的网址。...注意:当 301、302、303 响应状态返回,几乎所有的浏览器都会把 POST 改成GET,并删除请求报文的主体,之后请求会再次自动发送。...3. 4XX (Client Error 客户端错误状态)4XX 的响应结果表明客户端是发生错误的原因所在。(1)400 Bad Request该状态码表示请求报文中存在语法错误。...当错误发生,需修改请求的内容后再次发送请求。另外,浏览器会像 200 OK 一样对待该状态

1.3K50

腾讯云中间件产品月报(第5期)

TSW 能够追踪到分布式架构中的上下游依赖关系,绘制拓扑图,为您提供多维度调用监控与统计,助您掌控系统关键指标,及时发现错误调用与性能瓶颈。...# 多维度调用监控 监控各服务、服务接口、服务实例的调用情况,还能够侦测到对系统组件的调用数据;提供基于监控黄金指标(吞吐量、响应时 间、错误率)进一步统计分析能力,帮助用户了解系统各维度的运行状态。...# 支持主流框架 兼容包括 HTTP,gRPC,Dubbo 等多种主流框架组成的调用,支持您按照调用方式筛选调用。还支持按照特定 HTTP, gRPC 状态过滤服务调用数据,助力用户精准排障。...# 接入简单 无需修改业务代码,即可使用 TSW agent 接入服务,通过字节增强技术,能够做到无侵入的采集服务调用数据。...支持服务路由、服务鉴权、全路灰度发布、分布式配置、日志与调用等服务治理能力。

1.2K20

路追踪在腾讯云的落地思考与实践

,当把它们集成在一起,需要拥有一个更加成熟的现代化可观测体系来支撑,以便了解应用系统发生的事情。...,用户可能只对部分调用感兴趣,如出错的调用、慢的调用,如何来提升调用的存储价值; 字节增强的方式进行埋点,仅仅能覆盖已知的三方组件,当业务代码出现性能问题,已知的 Span 信息无法满足问题定位的需要...从应用拓扑到调用,实现路的错、慢下钻分析,这是一个经典的使用可观测平台实现的产品能力,通过拓扑图可以看到有异常的应用信息,选中该应用之后,可以关联到调用的明细的数据,在调用的界面我们可以看到出现了慢的调用...,或者是错误调用,打开调用的详情之后,可以进行下钻分析,看到此次调用的请求参数,以及调用堆栈和运行时产生的异常信息。...当服务端出现异常导致前端调用失败,站在客户端的视角,可以根据 TraceId,快速的找到服务端错误的原因。

45110

路追踪在腾讯云的落地思考与实践

,需要拥有一个更加成熟的现代化可观测体系来支撑,以便了解应用系统发生的事情。...,用户可能只对部分调用感兴趣,如出错的调用、慢的调用,如何来提升调用的存储价值; 字节增强的方式进行埋点,仅仅能覆盖已知的三方组件,当业务代码出现性能问题,已知的 Span 信息无法满足问题定位的需要...从应用拓扑到调用,实现路的错、慢下钻分析,这是一个经典的使用可观测平台实现的产品能力,通过拓扑图可以看到有异常的应用信息,选中该应用之后,可以关联到调用的明细的数据,在调用的界面我们可以看到出现了慢的调用...,或者是错误调用,打开调用的详情之后,可以进行下钻分析,看到此次调用的请求参数,以及调用堆栈和运行时产生的异常信息。...当服务端出现异常导致前端调用失败,站在客户端的视角,可以根据 TraceId,快速的找到服务端错误的原因。

29810

路追踪在腾讯云的落地思考与实践

,需要拥有一个更加成熟的现代化可观测体系来支撑,以便了解应用系统发生的事情。...,用户可能只对部分调用感兴趣,如出错的调用、慢的调用,如何来提升调用的存储价值; 字节增强的方式进行埋点,仅仅能覆盖已知的三方组件,当业务代码出现性能问题,已知的 Span 信息无法满足问题定位的需要...从应用拓扑到调用,实现路的错、慢下钻分析,这是一个经典的使用可观测平台实现的产品能力,通过拓扑图可以看到有异常的应用信息,选中该应用之后,可以关联到调用的明细的数据,在调用的界面我们可以看到出现了慢的调用...,或者是错误调用,打开调用的详情之后,可以进行下钻分析,看到此次调用的请求参数,以及调用堆栈和运行时产生的异常信息。...当服务端出现异常导致前端调用失败,站在客户端的视角,可以根据 TraceId,快速的找到服务端错误的原因。

51220
领券