首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

去哪儿如何实现故障率降低65%?技术+管理的数字化度量体系实践

在业务团队维度中,之前包含了一些故障的情况,比如故障率、团队的故障主动发现率和处理时长的超时率等。...1.4 实践效果 故障率从0.57%下降到0.2%左右; 质量门禁百分百开启;(以前,虽然在发布过程中有质量拦截机制,但并不是所有团队都开启了这些门禁,所以并没有完全发挥出它的作用。...例如在一个月内腐化,治理完后,可能在下个月又再次出现腐化) 建立了系统复杂度度量的标准和长效治理机制; 为研发团队系统复杂度提供了依据; 提高业务研发对系统复杂度的重视; 驱动业务研发持续关注与治理系统复杂度,降低系统稳定性隐患

20810
您找到你想要的搜索结果了吗?
是的
没有找到

月近万次发布,故障率

根据公司发布的数据显示,去哪儿网过去一年中,发布故障数和故障率都不断降低,并始终保持在4‰ 以下。开发和测试的比例也不断变化,从之前的1:1降至测试占开发的1/3。...因此,本次分享的功能测试左移,希望能够在降低成本、降低故障率、提高研发效率等多个方面为大家带来一定的帮助。 (近一年发布故障数、开发测试比例不断降低) 一、如何通过自动化测试降低成本?...二、如何通过智能推荐降低故障率? 2.1 支持的功能 自动化测试落地虽然降低了故障数量,但回归测试仍不能完全满足公司要求的低故障率。经过一个季度的数据分析发现,代码变更和配置变更是故障的主要来源。...2.3 实践效果 智能推荐的实践已经持续了两年,经过不断改进,在降低故障率方面取得了持续的成效。人工测试阶段3.8%发布故障率,在自动化平台落地后,已经降低到了1%以下。...加之智能推荐平台的实践,我们目前已实现故障率低于千分之4,达到了公司所关注的低故障目标。 三、如何通过本地化提高研发效率?

27110

服务器失效那些事

引言 服务器出现故障是大家都非常关心的,而服务器由CPU,内存,磁盘,主板,电源等多种部件组成,一定会有一定的失效率。本文介绍服务器失效的特性及一些部件的失效标准,探讨降低服务器失效对业务的影响。...2、并不是越新的服务器越稳定。服务器失效率本身符合浴盆曲线特性,在新机器使用的前3到4个月,故障率都会偏高一些,在接下来的2年时间里,失效率会下降到一个更低的状态,直到过保期,故障率又会大幅增长。...目前很多业务依靠RAID特性来规避磁盘失效造成IO中断的影响,但是这只是降低了概率而不能从根本上解决问题。因为RAID卡本身就会故障,会造成整机的IO中断。...有哪些降低服务器失效对业务的影响的方案? 虽然服务器失效是无法避免的,但是我们可以想办法降低业务受服务器失效的影响。比如故障预警就是一个好办法。...后续针对RAID失效、电源失效、风扇失效等故障的预警也会逐步推出,可以极大的降低业务受服务器故障的影响。

4.1K51

腾讯云服务器如何降低配置(领取腾讯云优惠券)

本经验介绍,腾讯云服务器如何进行降低配置的操作。前面已经介绍了如何购买腾讯云的低价服务器,现在讲解怎么样去降低配置,来达到延长服务器使用时间的目的。...首先,我们应当准备一台腾讯云服务器,购买方法可以参照下面的经验; 然后,我们打开腾讯云官网,然后找到云主机控制台,点击右侧的更多,如图所示; ?...然后我们点击确定按钮,就会就会改变服务器的配置,使用时间延长的目的也就达到了。 ?...END 注意事项 如果出现无法降低配置,可能是参加活动账号出现限制,这样就无法更改了,非活动机器不受影响; 如果本经验帮助到了你,请点赞和收藏,欢迎关注”京粉学院“。

11.4K20

服务器与普通服务器有哪些区别?

1、定义不同: 云服务器,是简单高效、安全可靠、处理能力可弹性伸缩的计算服务,是一个服务器集群。 普通服务器是一个服务器,位置相对固定,是提供计算服务的硬件设备。...2、配置不同: 云服务器无需提前购买硬件,即可迅速创建或释放任意多台云服务器,一切计算均在云端实现,降低开发运维的难度和整体IT成本。...普通服务器的构成包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类似,费用成本较高。 3、故障率不同: 云服务器是基于服务器集群的,因此硬件冗余度较高,故障率低。...而物理机则相对来说硬件冗余较少,故障率较高。 云服务器的优点: 1、云计算服务器,有效地解决了传统物理租机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。...RAKsmart机房拥有香港、日本、硅谷、韩国、新加坡等云服务器资源,支持最高1000M带宽,5+253IP供您选择,满足您不同的业务需求。

9K50

视频流媒体服务器中怎么降低直播出现的延迟现象?

我之前在很多文章中分享过我们流媒体服务器如何优化直播体验,详细讲解了各部分造成低延迟和卡顿的原因和相应的优化原理。...这样一个简单的优化可以降低延迟,因为它能够以更低的码率编码全帧率视频。...传输协议优化 在服务端节点和节点之间尽量使用 RTMP 而非基于 HTTP 的 HLS 协议进行传输,这样可以降低整体的传输延迟。这个主要针对终端用户使用 HLS 进行播放的情况。...如果有必要,可以使用定制的 UDP 协议来替换 TCP 协议,省去弱网环节下的丢包重传可以降低延迟。...以我们现有的科技水平,延迟的情况是不可避免的,我们流媒体服务器也在尽力解决这个问题,目前以上的两种延迟优化方法都可以在我们流媒体服务器上尝试解决。 ?

1.4K10

降低Redis内存占用

1、降低redis内存占用的优点   1、有助于减少创建快照和加载快照所用的时间   2、提升载入AOF文件和重写AOF文件时的效率   3、缩短从服务器进行同步所需的时间   4、无需添加额外的硬件就可以让...例子:   存储字符串’abc’,两个长度都可以用1字节来存储,因此所带来的额外开销为2字节(两个长度即1+1=2)   结论:   压缩列表是通过避免存储额外的指针和元数据,从而达到降低额外的开销。...以有序数组的方式存储集合不仅可以降低内存消耗,还可以提升集合操作的执行速度。...查看耗时   执行test2.php   结果为:执行次数:50000,耗时12s 结论: 在本机中执行测试50000条数据就相差8s,若在高并发下,长压缩列表和大整数集合将起不到任何的优化,反而使得性能降低

3.5K10

降低成本,提升性能:海外服务器租用的经济实惠选择

在当今数字化时代,拥有一个高性能的网络服务器对于企业和个人网站来说至关重要。然而,传统的服务器租赁往往价格昂贵,限制了许多人的选择余地。...幸运的是,海外服务器租用提供了一个经济实惠且性能卓越的解决方案。  一、海外服务器租用的优势  海外服务器租用相比传统服务器租赁有许多优势。首先,它提供了更多的服务器选择。...这意味着无论您的受众在世界哪个地方,他们都可以通过最近的服务器快速访问您的网站。这种全球覆盖不仅提高了用户体验,还可以扩大您的业务范围。图片  最重要的是,海外服务器租用可以帮助降低运营成本。...二、如何选择合适的海外服务器  选择合适的海外服务器对于降低成本和提升性能至关重要。首先,您需要考虑服务器的位置和地理位置。...总之,海外服务器租用是一种经济实惠且性能卓越的选择,帮助您降低成本并提升网站的性能。通过选择最接近目标受众的服务器位置,您可以减少网络延迟并提供更快的加载速度。

1K30

云计算技术降低了IT成本,但是降低的幅度会多大?

随着技术的发展,云计算技术降低了IT的硬件成本,比如用价格低廉的X86取代昂贵的小型机服务器,确实省了不少钱;而原来硬件的高可用性,需要通过软件和运维工作来弥补。...云计算技术降低了IT成本,但是降低的幅度会多大? 银行业用大型机,购买的是硬件软件加服务的一体化集成IT能力;电信运营商用高可用小型机+成熟系统软件+定制开发软件,购买的是整体解决方案和集成服务。...然而云计算让“IT成本”里的采购量大幅度降低,有没有考虑到:“IT成本”发生了转移,从采购项变成了人工成本。...最终的财务报表中,虽然硬件成本降低,但软件的成本会增加;虽然购买成本降低,但是运营开发成本会增加;虽然外包成本降低,但是内部人工成本会增加。...我不好披露企业的内部数据和信息,因此文中没有举出具体数字来量化说明;但定性分析亦能看出来,“云计算降低IT成本”的作用被夸大了。

1.7K70

降低OTT的峰值带宽

演讲主要涵盖了公司简介、降低带宽的原因、具体要降低的内容并提出了6种不同降低拥塞的技术(利用编码器,播放器和CDN技术等),最后给出了测试结果和对比。...Akamai是一个分布式全球化公司,向全球范围内提供内容和服务,服务器遍布全球4100个地点,136个国家,专注于媒体,性能和网络安全,同时也在物联网和区块链等新兴领域探索。...本次演讲提出了6种降低峰值带宽消耗的方法以降低网络拥塞,并通过一个播放器范例演示了每种方法对视频比特率选择和平均下载速率等的变化。 1....内容提供商去除最高比特率 在服务器源端手动修剪掉最高比特率,可以直接修改manifest来达到,这样可以在不改变视频的编解码参数直接控制视频码率,但是用户的观看质量会有一定程度的下降。 4....CDN动态修改manifest 在不能改变视频参数、源端服务器和播放器的情况下,Akamai CDN可以在传输视频的时候过滤某些播放列表,过滤可以通过请求、地理位置、时间等进行灵活调整。 6.

1.6K20

【鹅厂网事】服务器硬盘故障预测实践

理论上服役时间越长的服务器发生故障的几率也将越大,从腾讯全网服务器的统计结果也表明服务器老龄化的加剧,故障概率会加速上升,特别是使用年份超过4年的设备故障率将出现陡升的情况,显而易见高故障率的老龄化设备将对现网业务造成巨大的影响...我们的服务器使用年限超过5年后,硬盘故障率都是非常高。 于是乎,想快速有效的降低服务器故障的影响,核心就在于降低硬盘故障的影响。...或许这些服务器配置信息能给出一些统计结果,我们想要的是即将故障的硬盘,而不是这些差异性不大的各个集合的整体故障率。...成功预测的硬盘故障数量,粗略估算已覆盖SATA硬盘故障数的50%左右,进而促使5年以上服务器对业务影响的硬件整体故障率也下降了0.5%。...当然,我们也会与服务器厂商和设备供应商一起紧密合作,在FW和介质底层更深入的分析硬件失效的原理,对持续降低故障率发起挑战。

1.3K10

服务器硬盘故障预测实践

理论上服役时间越长的服务器发生故障的几率也将越大,从腾讯全网服务器的统计结果也表明服务器老龄化的加剧,故障概率会加速上升,特别是使用年份超过4年的设备故障率将出现陡升的情况,显而易见高故障率的老龄化设备将对现网业务造成巨大的影响...我们的服务器使用年限超过5年后,硬盘故障率都是非常高。 ? 于是乎,想快速有效的降低服务器故障的影响,核心就在于降低硬盘故障的影响。...或许这些服务器配置信息能给出一些统计结果,我们想要的是即将故障的硬盘,而不是这些差异性不大的各个集合的整体故障率。...成功预测的硬盘故障数量,粗略估算已覆盖SATA硬盘故障数的50%左右,进而促使5年以上服务器对业务影响的硬件整体故障率也下降了0.5%。...当然,我们也会与服务器厂商和设备供应商一起紧密合作,在FW和介质底层更深入的分析硬件失效的原理,对持续降低故障率发起挑战。

13.1K90

软硬一体化成趋势,腾讯云打造云计算基础设施

随着磁存储技术和工艺制程的发展,硬盘容量越来越大,故障率和故障恢复时长也随之变长,这会对云上开发带来很大的稳定性挑战。...腾讯云服务器运营中心专家工程师牛犇介绍,在来料质量方面,腾讯云采取基于业务模型的来料筛选机制,通过云业务模型与硬盘底层参数建模,分析参数统计分布,定制化筛选标准,使得硬盘年化故障率显著降低至1/5。...(腾讯云服务器运营中心专家工程师牛犇) 目前,腾讯数据中心正在运行的服务器超过100万台,经统计,硬件故障导致的系统宕机中,内存故障占比排第一。...腾讯云星星海实验室副总监李志高认为,解决数据中心服务器宕机率高的关键路径是降低内存故障率和减少内存故障导致的宕机。...(腾讯云星星海实验室副总监李志高) 腾讯云通过优化算法进行内存筛选、优选X4颗粒内存条、使能多种内存RAS特性等方式大大提升了服务器的可靠性。

1.5K20

云教室桌面云虚拟化瘦客户机解决方案

学生机采用桌面虚拟化方式,系统软件和应用软件均在服务器上,可防止未授权软件的使用和病毒的入侵。...客户端回写到服务器上的数据包是一个服务器无法读取的文件,即使学生机使用中中毒,也不会感染到其它学生机和服务器本身, 重启学生机就可自动清除原回写文件,保证了整个系统的安全稳定运行,其故障率较之普通电脑大大降低...桌面虚拟化瘦客户机是在网络环境下工作的,其运行的程序、数据都集中在服务器端,在这种工作模式下,整个系统的安装、调试、管理、维护、升级都由系统管理员在服务器端统一实现,客户端仅需要做很少的管理、维护工作。...因此瘦客户机采用的是高度集成化的系统结构,没有配置光驱,更没有其它等容易损坏的部件,停电和强烈振动等对它也无影响,故障率低,坚固耐用,使用寿命比普通计算机更长。

2.6K40

综合成本降低 66.5%!

云上资源包括了计算资源服务器、存储类的包括 MySQL、Redis、S3 等、大数据处理(EMR)以及网络资源等。...如此大的业务,如何实现高可用的一体化监控并降低云原生 Prometheus 的监控成本呢? 客户现状和痛点 经内部规划后,该游戏公司决定基于自建的 Prometheus 构建一体化监控系统。...新增云服务器监控实例,需重复进行配置。 解决方案 经与云监控团队交流后,云监控 Prometheus 监控服务团队提供了解决方案: 1. 优化运维成本,提升高可用。...支持按标签,动态抓取对应云服务器实例的监控数据。页面上分钟级完成 MySQL、Redis 等云资源监控集成,并提供开箱即用的监控大屏及报警模板。...[点击查看大图] 总结 通过接入腾讯云 Prometheus 监控服务,该游戏公司既有效降低运维成本,也保障了业务的平稳运行。 1.

62940

TPM是如何改善设备问题的?

通过TPM,组织可以建立高效的质量管理体系,降低故障率、提高设备利用率和降低成本。图片TPM如何改善设备问题?1. 建立全面的质量管理体系。...通过这些程序,组织可以确保产品质量符合预期要求,并降低产品质量不符合要求的风险。2. 实施全面的过程改进。TPM可以通过实施全面的过程改进来改善设备的性能和可靠性。...通过实施过程改进,组织可以减少故障率、提高设备利用率和降低成本。3. 加强培训和教育。TPM可以帮助组织提高员工的质量意识和技能。...这些员工可以更好地管理设备,减少故障率和提高设备利用率。4. 建立设备维护计划。TPM可以帮助组织建立设备维护计划,以确保设备的长期性能和可靠性。...通过监督和检查,组织可以及时发现和解决问题,减少设备故障率和提高设备利用率。

42930
领券