首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

提升测试质量的四个关键特征

今年写了很多质量保障相关的文章,也在星球内部或者公开做了几次分享,内容主要包括质量内建、质量门禁、测试左移、质量度量等。...SLA可信:对于线上业务和服务的稳定性来说,可控的变更除了要控制变更的影响范围,更要对变更带来的风险和可能导致的损失有具体的数值来辅助评估,因此SLA可信也可以看做是一种描述测试质量的目标。...SLA:服务等级协议,包含SLO(服务质量目标)和SLI(服务质量指标) 2个指标,常见的有P99,源于SRE工程实践的理论。...四大特征 聊完了现状和预期目标,提升测试质量的四个关键特征,如下图所示: 要提升测试质量,保障最终的线上交付质量,我个人认为测试过程应具备下面四个特征: 可识别:业务多样,场景复杂,在需求阶段就对业务迭代带来的影响范围和可能存在的风险进行识别...可量化:变更是正常的,变更是有风险的,对于变更影响的范围、可能存在的风险需要尽量做到可量化,做好兜底策略和应急响应机制,这样才能提升线上服务的可用性,提升技术对业务的支撑能力。

19520

IPv4迁移IPv6,那IPv6+又是什么?有哪些技术?【IPv6+连载01】

带宽需求巨大,连接数量极大,并且连接模型特别灵活,对SLA(Service Level Agreement,服务水平协议保障的要求也从仅仅提供连通性扩展到要提供严格的时延、抖动、丢包等综合能力,运维也随之变得复杂...IPv6+的技术体系主要归纳为三大类: 第一类实现基础的连接,这里面包括承载单播业务的SRv6协议和承载组播业务的BIERv6协议,这两个协议都是基于Native IPv6的架构进行承载转发,无论是控制面还是转发面...第二类是体验保障类的能力,包括可以预留网络资源,提供确定性网络能力的切片,以及对业务流传输质量进行实时检测的随流检测能力。...随着IPv6的规模部署,以SRv6为代表的IPv6+技术将在网络中广泛应用,构建出智能化、简单化、自动化、SLA可承诺的下一代网络。...如果出现劣化,及时调整业务配置,保障最佳用户体验。 阶段三: 在阶段,不仅要保障业务的体验,还要能做到更精细颗粒度的基于应用的体验保障

83041
您找到你想要的搜索结果了吗?
是的
没有找到

1位5年智能运维开发对智能运维的理解

这个时候,主要是接触了大数据相关的技术,包括:Kafka、Spark、HiTSDB、ELK等。   ...,由两本书对我影响比较大:   •《智能系统指南》:较为全面的介绍了人工智能各个分支的技术;   •《人工智能 — 一种现代的方法》:是加州大学伯克利分校的教授 和 Google 研究院主管 合著的一书...2019年:进入了千寻的运维保障部门,接触到了更为庞大的业务。对智能运维有了进一步的理解。...运维    •《Google SRE运维解密》:google 关于高可用保障的一数据;    •赵成的运维体系管理课(极客时间):关于运维的经验分享    •《AIOps标准白皮书...体系    •SLI,服务质量指标,服务的某项质量的一个具体的量化指标;    •SLO,服务质量目标,服务的某项SLI的具体目标值,或者目标范围;    •SLA,服务质量协议

1.3K72

公有云宕机如何赔偿用户损失?

微软的SLA协议是对云安全模式的一种有益的探索。...SLA服务水平协议(全称:service level agreement)是在一定开销下为保障服务的性能和可靠性,服务提供商与用户间定义的一种双方认可的协定。...显然,SLA协议为使用云服务的企业提供了很好的衡量标准,它有机会成为今后企业用户购买云服务时与供应商约定的标准协议。国内业界云服务供应商完全可以借鉴这一做法,为国内企业用户提供更完善的安全保障。...其实,云宕机率并不像大多数人想象的那么高,这个数据已从2012年的千分之一(即每年7.5小时——数据来源于MegaPath)降低至2014年的万分之五(见8月19日前微软SLA协议)。...所以云安全可以保障,企业用户可以放心使用,当然,也不要忘记与云服务供应商签订SLA条款,为你的使用增加一重保障

1.9K130

SLA通俗理解

SLA通俗理解 SLA 表征服务方与客户间的服务等级协议,定义服务方需保证的服务质量以及不达标情况下的服务补偿,在SRE领域,SLA 细分为 SLI、SLO 与 SLA: SLI,服务质量指标,服务的某项质量的一个具体的量化指标...SLA,服务质量协议,描述在服务不达 SLO 情况下的后果,可简单理解为 “SLA = SLO + 后果(惩罚)”。...由于SLA是交付给客户的协议,因此 SLA 中的 SLO 是需要可直观被用户感知的,直接影响用户体验的,这是 SLA 隐含的应有之义。...附件: 草拟网关服务的 SLA: 网关服务等级协议 服务等级协议(Service Level Agreement,简称 “SLA”)规定了网关向客户提供的 API 网关的服务可用性等级指标及赔偿方案。...赔偿范围包括以下原因所导致的服务不可用: (1)预先通知用户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练; (2)用户的应用程序或数据信息受到黑客攻击而引起的; (3)用户维护不当或保密不当致使数据

4.9K10

企业运维仅关注业务连续性是不够的,这两方面也很重要!

SLA/OLA 服务水平协议SLA, Service level Agreement):是服务提供商与其客户之间关于提供满足客户期望的服务的协议或合同。...SLA都是关于满足业务级别要求和管理业务期望的,例如,如果发生中断,业务可以期望服务中断多长时间; 操作级别协议(OLA, Operation Level Agreement):是服务提供商为其内部客户建立的遵守...SLA的承诺或协议。...书籍《SRE:Google运维解密》提出了Google SRE 服务可靠度的7层模型,包括: 03....本文结合个人多年工作经验和自身思考总结了运维工作的3个阶段,其中第一、二阶段更多还是聚焦在“事”本身,而到达第三阶段需要回归到“以人为”,同时借助精益、敏捷和DevOps思想,让员工满意,让客户成功。

65500

SLA、SLO与SLI的区别

类别 SLA(服务等级协议) SLO(服务等级目标) SLI(服务等级指标) 它是什么? 服务提供商和客户之间定义商定预期的合同承诺。 在 SLA 的更广泛范围内设定的具体、可衡量的目标。...什么是 SLA(服务等级协议) 从本质上讲,服务等级协议 (SLA) 定义了服务提供商和客户之间的期望。克服技术复杂性、客户偏好、语言清晰度和详细文档等挑战,对于优化 SLA 的有效性至关重要。...它的目标是帮助满足与客户签订的服务水平协议 (SLA),其特性包括 API 检查、浏览器检查、心跳监测等。 API 检测 API 检测会频繁地从全球各地的不同位置监测关键的 API 终端点。...此外,当任何监控检查引发故障时,能够接收即时通知的功能提供了维持流畅的 API 操作所需的保障。这种主动式的监控方法能确保 API 无缝运作,从而提高可靠性和用户满意度。...这包括检查正确状态代码、响应时间,以及根据预期结果验证响应主体。API 监控有助于及早发现可能违反 SLA 条款的问题。

14410

如何设计一个海量任务调度系统

由此衍生的功能和非功能诉求分别为: 功能性诉求: 任务管理:包括任务注册、任务启停、任务更新等, 任务查询:主要用于任务追踪、问题排查、调度统计等, 任务回调:由业务提供 spi 回调实现,tjobs...、运维,使用成本远低自建 高可靠:全年 3 个 9 可用性、p99(时延)<1s 高性能:支持 100w+TPM 的任务触发 多协议:支持多协议、组播、单播多种回调方式 综合看需要 tjobs 设计支持百亿级任务量和百万...tjobs 平台为达成上述任务量级和三个 SLA,需要在海量数据存储、高并发、触发时效以及高可用上做出相应的设计保障,下面分别讲述一下: 数据存储:重点解决两个问题数据可靠和海量存储,可靠的存储保障任务不丢...timingwheel 中(timingwheel 为秒级) timingwheel 到指定时间触发业务主要完成两个操作:生成调度流水并更新 task 下次执行状态 + 执行业务回调 根据业务回调配置(包括协议类型...,名字通过增加本地缓存实现弱依赖也能满足 SLA,现需要对定时调度平台和 tjobs 应用两个强依赖服务做容灾能力保障

1.1K30

SLA是什么?

a.定义 服务级别协议,是 IT 服务提供方和客户之间就服务提供中关键的服务目标及双方的责任等有关细节问题而签订的协议。既然名为协议,通常就是用法律术语完成,其内容包含所提供服务的范围和质量。...除了服务活动的定义外,定义淸晰、简明、一致性的数据点也是签定 SLA 双方避免风险,确保协议执行的必要条件。对于每一条服务级别的定义通常都包括以下数据点。...(8).沟通:规定在服务供应方打破 SLA 时,应在多长时间内通知何人。这包括在打破 SLA 时的升级行为和管理。 除了上述技术性的描述外,作为条款性文件,SLA还应包含例外情况、奖惩措施及计算方法。...服务级别协议 甲方:A 乙方:B 本协议覆盖 XYZ 服务的供成与支持,(简述服务内容)。 本协议有效期为 12 个月,从_年_月_日到_年_月_日。...内容包括测量点响应时间值及包含日期和时间的时间戳信息。 例外情况及奖惩措施:(略)

6.5K20

SRE方法论之服务质量目标

在这个过程中,我们需要定义一些服务质量指标(SLI)、服务质量目标(SLO),以及服务质量协议SLA)。这三项分别是指该服务最重要的一些基础指标、这些指标的预期值,以及当指标不符合预期时的应对计划。...常见的SLI包括请求延迟(处理请求所消耗的时)、错误率(请求处理失败的百分比)、系统吞吐量(每秒请求数量)、可用性(服务可用时间的百分比,运维行业经常用9的数量来描述可用程度。...目标SLO是服务质量目标(Objective):服务的某个SLI的目标值,或者目标范围。SLO的定义是SLI≤目标值,或者范围下限≤SLI≤范围上限。...协议SLA是服务质量协议(Agreement):指服务与用户之间的一个明确的,或者不明确的协议,描述了在达到或者没有达到SLO之后的后果。这些后果可以是财务方面的退款或者罚款,也可以是其他类型的后果。...区别SLO和SLA的一个简单方法是问“如果SLO没有达到时,有什么后果?”,如果没有定义明确的后果,那么我们是在讨论一个SLO,而不是SLA

19700

浅谈5G网络切片的商业应用

网络切片既是一种向客户提供 5G定制网络的业务, 通过配置网络参数, 向客户提供定制SLA保障的逻辑网络。 切片是一套调度机制, 本身不能产生资源, 是对资源的智能调度, 并形成服务。...可定制:网络的逻辑功能、关键SLA指标可定制,包括带宽、时延、丢包和抖动等传统网络指标,可以满足差异化的业务要求。...可隔离:网络切片可以实现不同层面的隔离,资源池隔离、VNF隔离等,通过网络资源的隔离和业务逻辑的隔离,实现业务的高可靠性、高安全性和服务SLA保障。...核心网切片主要实现网络切片在5G CORE部分的资源和阻网隔离与SLA保障。 端到端的网络切片,需要无线网、核心网和承载网共同配合完成。...1、 智慧警务 警务切片提供给警务部门,在签订协议的SA无线网覆盖区域(甚至包括空域),提供上下行速率、安全性、可靠性及可用性较高的移动上网业务,满足其对多媒体信息的通信需求和其他增值服务需求。

1.6K20

稳定性生产总结

在业务可用程度中我们最关注SLA、 RTO、 RPO。SLA是Service Level Agreement的缩写,中文翻译为“服务级别协议”。...它是一种协议约定,旨在保证服务提供商和客户之间的服务质量达到一定水平。SLA通常用于商业、技术和服务行业,以确保双方在合作过程中达成一致的服务标准。...1、建设稳定性保障机制其中包括:规范编制、方案评审机制、测试准入准出机制、值班及责任判定机制、能力考核机制、故障管理机制。...2、建设组织保障能力包括人力资源支持、技术资源支持、组织优化3、建设稳定性保障体系包括如下内容:​​在建设之后,我们可以依照如下指标来进行衡量建设的效果以上就是我们本期稳定性生产方面的内容了,故障的发生是复杂多样的...,定义业务或者服务的slo以结构化,来保障稳定性能力。

13600

快手实时数仓保障体系研发实践

主要内容包括: 业务特点及实时数仓保障痛点 快手实时数仓保障体系架构 春节活动实时保障实践 未来规划 01 业务特点及实时数仓保障痛点 frc-55e375289343e8a0d7db33db414ff794...快手业务的需求包括活动大屏的场景、2B 和 2C 的业务应用、内部核心看板以及搜索实时的支撑,不同的场景对于保障的要求都不一样。...准确性包括主备链路侧的一些对比,维度下钻是否准确;波动性是衡量持续指标的波动范围,防止波动大产生的异常;一致性和完整性通过枚举和指标度量保证产出一致且不存在残缺的情况。...一方面是对时效性、准确性、稳定性做 SLA 目标报警建设。另外一方面是基于链路的监控体系建设,包括链路监控、链路依赖的服务可用性监控以及集群资源监控。...本文为从大数据到人工智能博主「maolv, xiao」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及声明。

65120

为什么要考虑云备份策略

在Office 365备份方面,企业需要一个适用于其资产并与服务级别协议(SLA)保持一致的解决方案。...建立数据层时,企业可以向用户承诺重要数据在设定的时间范围内是安全的。 与恢复点目标(RPO)配对时,企业恢复时间目标(RTO)会影响内容的特定服务级别协议。...管理员可以通过提高按需恢复内容的能力,并按照服务等级协议(SLA)中承诺的时间表避免出现问题。 •内容保真度:企业的内容需要恢复到什么级别?...将企业的数据层整合到服务等级协议(SLA)中,这样每个人都知道在潜在的灾难性系统故障期间会发生什么,并为企业IT团队提供更充分的空间。...企业为了成功应对数据丢失情况(并避免针对IT部门的大量相关电子邮件),需要确保恢复策略包括: •基于敏感性和业务重要性,定义良好的数据层 •涵盖内容恢复速度、规模和方法的准确服务级别协议 •明确的恢复点目标和恢复时间目标

86410

数据SLA服务保障

一.背景         团队成员在数据SLA服务保障缺乏意识认识、行动的执行策略、以及事故的档案管理、进行经验积累与复盘。基于时间推演,复盘总结不断迭代完善,最终目标是达到服务可用性在4个9。...SLA服务保障体系 SLA体系 (1).png 三. 前置条件 1.如何意识到重要性 从告警信息开始,含技术告警余人肉通知,电话与短信告警信息类似SOS标识(告警的级别与收敛)。...SLA的影响成本也是从异常发生的时间开始计算(含休息时间)。      2.如何找到人 在职期间(含请假时间),owner对数据服务可用性负全责。...其次推动开展基于SLA做复盘管理,迭代与完善。 3.如何响应 AB机制 横向选择:B角色同职级担任,进行工作代理与SLA服务保障。...电话告警范围(失败,数据质量强规则红色预警可以触发电话告警,任务阻塞(数据量为0,数据量波动超过经验阈值))。

2.2K50

IPv6+:构IPv6创新基因,筑新基建智能底座

IPv6+ 1.0 SRv6:通过SRv6(分段路由)实现端到端路由、简化协议和业务配置,做到路径优化、组播一点到多点、自动倒换降低时延、可以用多路由来保障可靠性。...它由SDN根据网络资源和用户SLA(服务质量要求)来计算端到端路由,以SRv6方式传递。...总的来说,IPv6+云网解决方案,可以实现多云连接,保障体验,简化运维,一网多用。差异化保障入云体验,实现了快、优、稳、省,做到网络服务的提升,更好的满足客户的需求。...使能故障快速收敛;四是灵活可编程能力,运营商快速使能NaaS,三层网络可编程空间能力,灵活使用;五是超大规模组网及易规划性,IPv6地址即标签,路由聚合,超大规模组网;六是IPv6+的可扩展性及演进性强,包括协议扩展...新基建作为国家的重大发展战略,对IP网络也提出了新的诉求,包括自动化、云网协同、确定性时延和抖动、差异化服务、大带宽等。

81960

WeOps一体化运维平台上新,云原生纳管+自动发现采集

本次WeOps V3.10版更新主题如下:扩充云原生纳管,新增K8S纳管,支持自动发现采集优化知识库,为经验传承提供更好用的工具IT服务台持续优化,支持SLA和运营分析着眼用户体验,优化功能操作1)资产清单新功能...使用WeOps平台轻松三步即可实现纳管和发现2)IT服务台新功能:新增SLA功能,让运维服务更加有效SLA功能旨在为IT部门与企业员工提供运维服务的品质、水准、性能等协议,用于提高IT运维部门的工作效率和满意度...WeOps新增SLA功能,包括服务模式设置和服务协议管理,支持根据IT运维部门的工作时间/加班时间/假期时间,灵活设置服务模式;支持根据单据优先级设置处理时长、设置超时提醒方式等。...比如,A公司运维部门有要求,针对优先级为高的工单要在4个小时内处理完成,可以通过设置SLA服务协议来实现,工单优先级若为高,则将按照设置的处理时长计时,若即将超时/已经超时,可收到对应的提醒通知,避免错过紧急重要的工单...③ 远程管理支持VNC协议,不断拓展能力为了适配客户多协议的现状,远程管理除了之前的SSH/RDP协议外,WeOps V3.10版新增VNC协议,满足客户VNC协议下远程服务器连接的需求。

1.2K30

Tapdata Cloud 场景通关系列:数据入湖仓之 MySQL → Doris,极简架构,更实时、更简便

应社区用户上生产系统的要求,Tapdata Cloud 3.0 将正式推出商业版服务,提供对生产系统的 SLA 支撑。...现代的 MPP 架构、向量化查询引擎、预聚合物化视图、数据索引的实现,在低延迟和高吞吐查询上,都达到了极速性能 简单易用:部署只需两个进程,不依赖其他系统;在线集群扩缩容,自动副本修复;兼容 MySQL 协议...不同于传统 ETL,每一条新产生并进入到平台的数据,会在秒级范围被响应,计算,处理并写入到目标表中。同时提供了基于时间窗的统计分析能力,适用于实时分析场景。...数据一致性保障 通过多种自研技术,保障目标端数据与源数据的高一致性,并支持通过多种方式完成一致性校验,保障生产要求。...专享订阅折扣:新版 Tapdata Cloud 将推出收费版本,用户可获得 SLA 级服务,保障生产使用的要求。内测用户将获得优惠订购特权。

56310

消费者云CSE微服务实践

华为消费者云业务简介 华为消费者云业务包括华为应用市场、华为视频、华为钱包、华为运动健康等服务,为华为和荣耀手机提供精品云服务,提升用户体验。...服务自治:通过在线的微服务治理结合云平台,可以实现微服务的弹性伸缩、故障自动迁移、降级熔断等,保障微服务的运行质量,提升业务SLA。...服务框架不要绑定具体的语言实现,例如内部通信协议使用某种语言特定的序列化机制、发布泛型、抽象接口等。...不是所有业务都有苛刻的性能需求,不同业务对性能的诉求不同,可以按需选择协议和传输方式,服务与传输协议、序列化方式解耦。...CSE在消费者云业务的实践——服务治理能力 为什么需要服务治理:随着业务的发展,服务越来越多,如何协调线上运行的各个服务,保障服务的SLA,对服务架构和运维人员是一个很大的挑战。

948100

基于高可用的可伸缩架构方法论生态

6、服务等级协议(SLA) 服务等级协议是团队和服务所有者之间的协议,提供了一个沟通服务间期望的机制。...6.1 服务等级协议定义 服务等级协议是一个提供某种级别可靠性和性能的承诺,它们用来在服务所有者和用户之间创建一个牢固的合约关系。...SLA需要结合具体服务的业务场景,和利益相关者协商服务之间的期望,比如可用性、性能、产品功能等 6.2 SLA性能检测 调用延迟 流量 运行时长 错误率 6.3 SLA阈值 SLA必须要设定阈值...级联式的服务故障 依赖的服务发生故障会影响可用性,可以说业务团队几乎每天都在忍受或者着手解决这些故障,因为谁也不能保障我们所依赖的服务什么时候会挂,很多业务团队也没这个经历去梳理这个问题,很多都是被动的等故障发生...如何确定故障 乱码响应 表示致命错误发生的响应 结果可以理解但是所需的结果不匹配 结果超出预期范围 没有接收到响应 接收响应很慢 如何解决故障 优雅降级 优雅补偿 尽早失败 8、应用程序可伸缩方法论 ?

90220
领券