首页
学习
活动
专区
工具
TVP
发布

(1):认识

前言 之前断断续续写过一些相关的技术文章,很多同学评价还不错。朋友建议我写个系列,基于自己的落地实践经验,对做个系统性的梳理总结。...定义:如何理解 PS:这里的定义是我基于自己对生产的了解和实践总结得来的,仅代表个人观点。 1、什么是?...相比于传统的方式,作为性能测试领域新阶段的最佳实践,它们的差异如下: 类型 传统 方式 Jmeter、Locust、Loadrunner 集群、流量引擎、录制回放...流程:生产落地实践 生产的整个流程,大致可分为三个环节,每个环节的主要事项如下: 能力建设:生产能力演变历程 生产的本质是能力建设的技术工程,不是一蹴而就。...7、生产 通过上面几个步骤,从基础的能力建设、体系建设,到线上的监控能力、只读场景练兵以及数据隔离到试点验证,最终才能达到生产核心的过程。

2.9K20

(14):生产SOP

——来自百度百科 本篇文章要说的SOP,实际上就是我在实践的过程中,对实践经验和教训的一个总结。...(1):认识 (2):方案调研和项目立项 (3):技术改造和测试验证 (4):的价值是什么?...(5):生产实施流程 (6):确认范围和识别风险 (7):核心四问 (8):构建三大模型 (9):容量评估和容量规划 (10)...:测试要做的准备工作 (11):聊聊稳定性预案 (12):生产必不可少的环节 (13):高可用和性能优化 再加上本篇的生产SOP思维导图,就是整个系列的内容。...最后,重申一下我对的部分认知: 是一个技术工程,而非单纯的测试手段; 只适用于部分企业和业务类型,而非一个银弹; 的落地并非一蹴而就,需要较好的技术基础设施建设做保障

62610
您找到你想要的搜索结果了吗?
是的
没有找到

(5):生产实施流程

前言 前面的几篇文章从生产的定义,内部立项和技术调研,聊到了测试验证以及的对企业业务和技术团队的价值,算是整体上的构建一个认知的概念。 从这篇文章开始,会进入具体的落地实践环节。...这篇文章中,我会介绍生产的落地实施流程,即每个环节要做什么事情。 四大阶段 如果将生产作为一个阶段性的技术项目来看,从开始到项目结束,需要经过四个阶段。...整体的实施流程图如下所示: 接下来我来为大家解密,生产落地实施,在不同的阶段都会做哪些事情。...筹备阶段 确定业务范围 一般来说线上实施线上之前,要明确本次需要验证的业务范围。...核心业务定义 出问题会影响其他业务; 流量较高且出现问题会影响整体业务目标的达成; 核心项目定义 前面提到了生产是个复杂的技术项目,那么如何定义这种技术项目呢?

1.3K40

(4):的价值是什么?

前言 在前面的几篇文章中,介绍了的背景、在企业中的立项流程以及落地的一些技术方案。...在开始真正的介绍落地实践过程以及相关案例之前,我想和大家聊聊,我对的一些认知,即:在技术团队中的定位,以及它的价值是什么。 业务和技术是什么关系?...对稳定性保障的价值 聊了这么多,回到文章顶部,我所要表达的内容,的价值是什么?...,通过前面的几篇文章,从认识测到项目立项以及技术调研和测试验证,我试图从另一个视角来为大家揭秘的另一面。...下篇文章,我会为大家介绍,落地实践的整体流程。

1.2K20

再谈

面临的挑战 除了上面所说的技术层面的问题,要开展,还面临如下的几点挑战: ①、由于涉及的系统及场景较多,因此需要跨团队沟通、跨系统协调改造,公司体量 越大,这一点难度就越大; ②、涉及的系统较多...不过的优点也很明显,比如:优化联络薄弱环节可以提高系统的可用性,容量规划可 以节省成本,提高效率。 开展前的准备工作 在开展之前,我们需要做哪些准备工作?...,也避免对正常的服务造成干扰; 监控的重点,主要是对应服务的TPS、不同百分比的RT、成功率、资源耗用、服务状态、告警等 信息; 平台架构设计 要开展,那么一个合理高效可用的管理平台...,是很有必要的,参考了很多 的设计思路,我个人的想法中平台的架构设计,主要由以下几部分组成: ①、Controller:主要任务为任务分配、Agent管理; ②、Agent:负责心跳检测...具体的架 构设计图,可参考京东的军演系统ForceBot的架构设计,如下图: ? 完成了上面的工作,接下来就可以开展的工作了。

68010

(7):核心四问

前言 前面的文章介绍了的落地实施流程,其中有个环节我特别提到了它的重要性,同时这也是本篇文章的主题:核心梳理。那什么是核心?为什么要确定核心?如何进行核心梳理?...梳理核心的目的又是什么?这篇文章,我会给你答案。 什么是核心? 之前在一些线下沙龙分享或者线上直播时候,很多同学都会问我一个问题:什么是核心?好像这个词有种魔法,很难让人去理解。...这么说比较拗口,再直白一些就是:哪些接口会影响用户下单支付,哪些就是核心。 下面附一个常见的电商企业核心流程图,供大家参考。 为什么要确定核心?...流量模型 我在前面的文章《生产实施流程》中有提高转化技术指标的一个案例,这里再次回顾下: 客单价为500,单日GMV为10亿,那么支付订单量为10亿/500=200W; 假设日常支付订单量为...文末回顾 这篇文章主要聊了在备战阶段最重要的一件事,核心梳理。其中提到了流量模型相关的内容,下篇文章,我会以过程中需要梳理的三大模型为主题,为大家介绍它们。

1.3K21

聊聊传统的区别

传统方式已经无法满足业务和技术的发展需要,,就是在这样的背景下应运而生的。作为性能测试领域新阶段的最佳实践,在更多公司被探索和应用的过程中,也遇到了种种挑战。...传统的区别 相比于传统的方式,在性能测试领域,有其独到的特殊性: 类型 传统 工具 Jmeter、Locust、Loadrunner 集群、流量引擎...落地过程中的挑战 虽然解决了传统过程中的种种痛点,可以为线上性能评估提供更多详实的参考建议。...一次偶然的机会,我了解到了开源平台Takin。 开源产品:Takin 最开始了解到Takin,还是因为相关的事情。...相比于复杂的实践来说,这点时间已经很短了,但对于没有太多生产实践或者技术比较薄弱的测试同学来说,难度稍微有点高。

1.4K10

换个角度,聊聊

前言 之前自己也写过好几篇关于的文章或者博客,最近看了infoQ上infoQ-数列科技杨德华的专栏,复盘了下自己以往在实施方面的工作,发觉还有很多可以做的更好的地方。...18年初:聊聊 19年初:再谈 20年初:测探索实践之路 19年双十一备战:第一次实践 20年618大促总结:生产实践之道 20年双11大促总结:落地和演进之路...技术 很多同学说起,都喜欢深究它的技术细节,这没错。但想要成功的在生产环境实施,更多的是考验组织协调能力的一个项目。...总的来说,除了技术,更多的还需要沟通与协调。 实施 到了实施阶段,基本就只能硬着头皮硬上了,特别是第一次搞生产,至今记忆深刻。...价值 最开始我司推动实施测时,我画了下面这张图,用来体现的价值: ?

81920

分析(纯干货)

原创来源于软件测试架构师俱乐部,作者cctester 最近网传,微信支付崩了,哈罗出了问题,部分公司性能测试架构师招聘又开始火热起来,现在都叫做,那什么是呢,跟传统区别是啥呢?...最早是阿里提出来的,在2012年的双11,零点的时候,系统交易成功率不足50%,下单报错,购物车报错,并伴随着大量超卖,后来提出了,这篇文章就来聊聊的关键点。...,模块为主,所以在这样的背景下就诞生了,我们的前提是在线下已经模块完成,无明显瓶颈的情况下开展,在线上进行的充分模拟。...3.的核心是什么? 无论何种测试,核心的东西一定是需求分析,那性能需求分析的要点是啥呢,和传统线下性能测试有啥区别呢?...监控分析: 大多是情况下,我们会做硬件层的监控包括cpu,带宽,内存,磁盘等,然后客户端进行数据采集,指标一般也通过数据采集,但这些在中还是显得还有基础,我们需要去通过更多服务器维度监控,

2.4K11

ZLJ卖场-演进

什么是 当接手ZLJ卖场所有业务性能测试后,重新调整性能测试流程和规范,每个项目进行登记,不再是单一接口,都需要制定对应的场景,后续在双十一、双十二大促的时候,也把场景补充进来...在此之前,自已也有了解过一些大厂的相关资料,感觉大同小异,差不多都是根据业务特性进行全场的,各场景流量大小配置,数据模型,性能分析等等。...整个过程离不开相关成员的支持和协助 开展 ?...根据的结果,基本可以明确各业务场景具体的qps峰值,结合业务数据和现有机器数量,进行一系列机器容量扩容。...对于双十一、双十二这类大促活动,必然是保障核心业务稳定性的保障手段之一。 end

2.3K10

常态化方案

前言 大半夜熬夜写方案,顺带整理了在上家公司做性能基线和常态化的方案,仅供参考。 前置条件 已在生产环境落地!...流程机制 准备阶段 测试环境 确认被变更范围 每次版本发布或线上进行变更,都需要,第一步首先确认本次被的变更范围,主要有如下几点: 被变更范围涉及的业务场景; 被对应的接口以及本次变更涉及的字段...——评估需要重新准备的数据; 表结构同步&服务发布 测试环境功能验证通过后,表结构变更到环境/预发环境/环境; 如果有多套环境,建议选择某个环境为基准环境,一切表结构变更从基准环境自动变更到其他测试环境...; 被对应的服务分支发布; 脚本调试&数据准备 准备相关测试数据——最好能有自动化的数据准备机制,这样能节省很多时间; 复用已有脚本,更新本次被设计的接口及脚本; 建议梳理出线上核心业务的...设定并检查的SLA阈值,确保测流量不会导致生产服务负载过高出现异常; 执行任务 按照制定好的任务,启动执行(可以设置为定时任务,避免通宵); 报告汇总&过程复盘 收集相关数据,输出报告

77340

|新人第二问:须具备的三大特性

这些产品之间有什么不同?或者有没有什么核心原则或者特性是必不可少的?”...的隔离性,主要是指压数据的隔离,这部分是的技术挑战难点之一。 数据隔离:表现为在整个路上任何一个节点都可以轻松的识别出当前处理的是测流量还是正式流量。...的稳定性,主要指压实施过程中的要保障业务的可用性,不能因为接入导致生产的事故。...这个阶段会遇到很多复杂的问题,比如说: 本来应该隔离的数据被当成正式数据来处理,导致线上环境污染 中产生的消息未及时消费,导致通道堵塞,影响正常业务 过程中服务调用超时,部分框架的重试逻辑会导致标签丢失...隆冬强听完小黑的的CIR原则后,对于的三大核心特性有了一个全新的认识,同时对于实施的难度也有了一个更深刻的理解。

63420

落地和演进之路

,作为电商大促的稳定性保障利器,也在不断的迭代演进。这篇文章,为大家介绍下在我司的落地和实践演进史。当然,其中的某些敏感部分已脱敏,请谅解。...落地 挑战 去年双十一,为了应对零点的峰值流量冲击,我们在八月下旬启动了第一次。由于是从零开始,因此单独的搭建了一套和生产1:1的环境。2个月的时间,环境成本就高达几百万。...核心梳理 电商业务本身比较复杂,且当前阶段我们微服务架构下,各个服务间依赖高,调用关系复杂,且没有较为清晰的梳理。所以,面临的第一个挑战,就是从错综复杂的系统中梳理出核心业务

1.1K20

滴滴解决之道

在此背景下,滴滴启动了项目。 一 方案 滴滴的业务与普通电商差别较大,一次典型的用户打车流程是这样的:乘客发单,0-3 分钟内派给附近的司机,司机抢单后,去接乘客,到达目的地。...基于滴滴业务的特殊性,同时借鉴了业内的经验,我们制定了滴滴的方案,一句话描述就是:在线上环境,针对业务核心,以数据隔离的方式进行,如下图表示: ?...但并不全是好消息,启动的时候,Trace 系统在滴滴内部并未完全推广,不少系统不支持。...从 2016 年中项目启动,经过多次尝试、探索,终于在线上成功进行了。...展望将来,期望能在更多领域发挥作用:线上环境的故障注入和故障演练;线上灰度发布环境的正确性验证;线上系统的容量预估等。

2K40

(12):生产必不可少的环节

前言 系列到这里,已经是第十二篇文章了,整个系列大概有14篇的样子,预计这个月会更新完毕。...因为严格来讲,并不是一个单纯的测试手段,而是一整套团队协作和稳定性保障的技术体系。 当然,这个系列文章叫做叫做生产,那肯定少不了在线上生产环境的实践。...这篇文章,为大家介绍下在生产环境都是如何开展的,以及过程要注意哪些事项。 在生产环境开展,相对于测试环境来说风险和成本都是比较大的。...当然,由于成本和风险问题,本身只适合部分企业,而非一个放之全行业通用的技术银弹。即使在少部分落地了生产的企业来说,常态化的也是很难的。...下面是一个在电商企业双11大促时候的生产实施过程,仅做示例参考。 执行和问题处理 生产其实和我们日常的没有太多区别,也是需要经过多轮的实施和问题分析定位优化才能完成。

1.7K20

滴滴解决之道

在此背景下,滴滴启动了项目。 一、方案 滴滴的业务与普通电商差别较大,一次典型的用户打车流程是这样的:乘客发单,0-3 分钟内派给附近的司机,司机抢单后,去接乘客,到达目的地。...基于滴滴业务的特殊性,同时借鉴了业内的经验,我们制定了滴滴的方案,一句话描述就是:在线上环境,针对业务核心,以数据隔离的方式进行,如下图表示: ?...但并不全是好消息,启动的时候,Trace 系统在滴滴内部并未完全推广,不少系统不支持。...从 2016 年中项目启动,经过多次尝试、探索,终于在线上成功进行了。...展望将来,期望能在更多领域发挥作用:线上环境的故障注入和故障演练;线上灰度发布环境的正确性验证;线上系统的容量预估等。

78520

(8):构建三大模型

前言 上篇文章主要介绍了在准备阶段,最核心的一点:核心相关的知识。 梳理核心的一个重要目的是获得流量模型。但在中,除了流量模型,业务模型和数据模型一样重要。...最终我们会得到类似如下的一个流量模型图: 数据模型 关于数据模型,实际上可以分为2个部分:模型和数据模型。...在目前的微服务架构下,整体的性能瓶颈,取决于短板(木桶原理)。因此,单机单路基准测试的目的,是在开始前进行性能摸底,定位排查瓶颈。...2.单机混合场景(服务级别) 单机混合场景,大多还是通过梯度增加请求的方式,观察服务级别的性能表现。 单机混合的目的,是排查上下游调用依赖的瓶颈,并以此测试结果作为限流预案的基准值。...重点关注3个指标: 安全水位(CPU50%) 告警水位(CPU70%) 最大水位(CPU≥90%&Load5≥150%) 3.生产场景(生产集群) 针对生产集群的,需要涉及的模型较多

1K30

开源平台Takin实践笔记

1.探针方式接入,不需要修改业务代码; 2.治理:能够帮助业务和微服务架构分析业务,以技术方式获得功能视角的信息; 3.性能瓶颈定位:性能测试结果可以直接展现整个中存在性能瓶颈的微服务架构节点...PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8; 简介...,称为业务活动 业务活动的服务名组成:http的path +# +请求方式 demo里的业务活动即为:/gateway/api/register#POST 图 ?...实况正是在过程中对进行实时监控的可视化界面,实况的全部数据都会保存在测报告中,也可以手动停止,直接到测报告中查看完整数据。 ?...选择耗时较长的请求,查看调用详情 ?

2.3K40
领券