记线上bug分析

你的关注和转发是王豆豆的最大的赞赏,谢谢各位的支持。

昨天下午大神把组内几十号人召集在一起开Online bug分析大会,主要是针对近期线上事故从事故原因和解决方案两个维度来分析。

对金融软件来说,每一次的线上事故都有可能给公司带来重大的损失,少扣了用户的钱,为公司带来资金方面的亏损;多扣了用户的钱,则为带来不必要的合约或法律纠纷,故测试金融软件不比其他行业的软件,后者线上bug大多不会直接引起资金方面损失,最多就是用户体验不好,功能没有实现,导致用户量的流失。

对金融软件来说没有小bug,一旦出现bug那就是重大的bug,必须引起高度重视。

俗话说”人非圣贤,孰能无过“,软件是由人编写的,所以再所难免都会有问题,而我们所要做就是尽量避免出现问题,或者是避免出现重复的问题。

对于软件测试人员来说分析线上BUG是非常好的一个措施,这样可以检测到测试人员在测试过程中哪些地方考虑不周,或没有考虑到,从而可以提醒测试人员下次思考的范围扩大,尽可能地完全覆盖测试范围。

从分析结果的角度出发,线上bug大多都是开发人员和测试人员麻痹大意所导致的,并不是不可避免的。

经过分析得出线上的bug出现的原因基本有以下几类:

1.开发人员使用java框架错误

2.开发人员上线时合并代码不仔细,导致代码有遗漏

3.测试人员回归测试流程不全

4.多系统一起上线,缺少联调或者联调不全

01

开发人员使用java框架错误

这个问题已经出现了两次,在8月份就出现过一次,原因就是开发人在使用多线程时,将多例使用成单例,导致系统在高并发进出现了串数据的现象,导致系统在处理时放错款,将A的钱放到B的账户中去了。

虽然使用单例能节省资源,降低系统的占用率,但这种情况并不合适目前的系统。

而此中情况在测试过程中并不一定能测试出来,这种出现的机率不定,必须在数据高并发时才有可能出现。

解决方案:技术问题,将单例修改成多例。

02

开发人员上线时合并代码有遗漏

开发人员上线时删除了master中的某行代码,引起有个变量没有定义,导致上线之后某功能失效。

开发人员将git分支上的代码合并到master时,master提示某一行代码没有,开发人员就将分支上的代码删除再合并到master,等将代码上线之后,导致某个功能失效。

解决方案1:开发人员将代码合并到master时,先将master上的代码拉到一个新分支上,然后再将要合并的代码合到新分支上,最终将新分支上的代码合并到master上。

解决方案2:开发人员建立良好的习惯,在开发某个项目时,每天(固定频率)都将master上的代码合并到自己代码的分支上

03

测试人员回归测试不全==漏测

说是回归测试不全,其实就是相当于一定程度上的漏测,漏测应该是软件测试人员尽量避免,一般漏测是因为测试人员思考不全,导致某个方面没有测试到。

这次线上bug分析有以下几个问题:

回归测试时,验证某个流程,但只验证到任务创建,就没有执行任务,上线后,该任务创建后执行会报错。

未测试幂等性,上线后,导致两次返回的结果不一样。

开发修改某一个bug,回归测试未回归以前的流程,导致上线后,原来正常的流程执行不通过。

解决方案:

1.回归测试时,主流程必须回归,并且有完整的回归步骤。

2.一个业务流程测试必须跑完一个完整流程。

3.测试过程中一定要细致,不能遗漏重要的点。

软件中的bug不可能完全测试出来,但最不应该出现的就是原本是正确的流程或功能,经过版本改动,在后期又出现,但测试人员再次测试时竟然没有发现,像这种情况是软件测试人员最应该避免的,所以回归测试很重要,不仅要回归主要流程,还需要回归修改bug相关的代码部分。

解决回归测试流程测试不全最好的解决方案就是引入自动化,就目前我们的系统不够成熟,改动太多,业务流程或需求都不稳定,所以自动化测试还未正式引入。

04

多系统一起上线,缺少联调或联调不全

因为联调出现问题也不再是一次二次了,为什么联调会出现问题呢?

公司业务是由有多个系统组成的,同时还需要调用其他公司业务接口,测试人员在测试时调用相关系统接口时模拟返回或回调,基本都是使用的mock,mock返回的值并不是真的从相应系统的返回值,所以如果联调测试时没有把握好,就非常容易出现问题。

在测试过程中联调就非常重要,但由于联调测试人员的放松,对联调内容的遗漏,导致业务上线之后:

1.调用某查询任务,对方会一直返回处理中,导致流程卡住。

2.A系统回调B系统失败,原因是编码方式不一样。

3.某系统功能失败后,调用查询接口报错。

4.调用某系统,应返回code=1,结果返回code=0,导致业务处理错误。

以上问题都是由于系统之间的调用或回调导致的线上bug。

解决方案:

1.在联调之前先将自己系统中本次项目所有用例测试完全。

2.编写联调用例,并且与多方测试人员沟通,确保联调用例能全面覆盖业务流程和任务。

3.在联调时,确保所有业务流程是全部走通,且返回的值正确。

联调测试与平时的功能测试重点和关注点都不同:

1.联调测试保证业务流程是通的。

2.联调测试时要检查其他系统返回来的数据是否正确?检查相同数据在各个系统存的值是否相同?

3.检查推送的报文mapping与其他系统接口文档中的mapping是否一致(映射)。

此次线上BUG分析再次验证程序中的bug就是人为的,避免这些情况就需要开发人员在开发过程中多注意,培养良好的编程习惯,而测试人员在测试过程中需要将测试范围考虑完全,尽量避免遗漏测试点,对于不清楚的点,不管是开发还是测试人员,都应该拿出来讨论,切忌闭门造车,不懂装懂。

大家可以一起来说说你们线上发生了哪些重大事故?让你开始引以为戒了。

原文发布于微信公众号 - 资深Tester(zishentester)

原文发表时间:2018-01-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏图形学与OpenGL

实验3 地理空间数据可视化

实验结果:(1)自己家乡及其位置信息;(2)图8-10,可以手绘,可以文字描述,也可以将图缩小打印贴上;

982
来自专栏北京马哥教育

Python Web不知道怎么学?看这篇就够了!

Python的用处太多,前端、后端、数据、ML\AI、自动化等等等等。很多小白不知道学习方向导致学的东西太杂,技能范围很广但是没有高度,自己玩可以工作就完蛋。这...

33910
来自专栏腾讯大讲堂的专栏

王者荣耀大数据运营总结

围绕王者荣耀大数据运营,依托对局日志和好友关系,开展了王者周报、赛季总结和周年庆活动等项目。这些案例中,遇到了哪些挑战?

3854
来自专栏闵开慧

lamp兄弟连的解决问题套路

首先我想说问这些问题的除了第三个问题可能会有人跟你讲讲什么个意思以外,估计大部分问题都是未遂。。。有人问完没反应还说 “大家不帮我”。。。不是不帮你,是你问问...

3378
来自专栏WeTest质量开放平台团队的专栏

60帧的丝般顺畅 - QQ飞车手游优化点滴

加入项目组的这段时间主要是承担性能优化这块的工作,同时也会去实现一些场景材质、特效材质以及工具。今天就性能优化这块分享一下个人的经验。

1716
来自专栏企鹅号快讯

web前端开发的学习内容:致那些有意学习web前端开发的人

最近很多人都在问我想学web前端开发,我要学那些东西。今天我就在这里跟大家说说学习的内容: ? 第一:认识网站前端 资源准备 前端目前人才需求巨大,真正会的人甚...

3376
来自专栏CodingToDie

夜的十二章:第二夜 编程伊始

在上大学前,我家并没有电脑,因为我父母并不会使用,我也不在家,他们感觉,买了放在那里不用也是浪费钱。

582
来自专栏WeTest质量开放平台团队的专栏

60帧的丝般顺畅 - QQ飞车手游优化点滴

加入项目组的这段时间主要是承担性能优化这块的工作,同时也会去实现一些场景材质、特效材质以及工具。今天就性能优化这块分享一下个人的经验。

652
来自专栏opengps

百度地图JavaScript开发入门教程

        自从openGPS.cn小编在2011年的一个WEB项目中用到了百度地图做售楼数量分布显示功能之后,就一发不可收拾,在位置服务的领域一路走了5...

3077
来自专栏opengps

[置顶] 百度地图JavaScript开发入门教程

        自从openGPS.cn小编在2011年的一个WEB项目中用到了百度地图做售楼数量分布显示功能之后,就一发不可收拾,在位置服务的领域一路走了5...

3135

扫码关注云+社区