导读
日前,有网友发微博称,外卖订单付款出现延迟,部分用户付款后系统仍提示尚未付款;团购页面内容也无法正常显示。美团服务器出现大面积崩溃。
网友趣谈:
1、这是一个上了热搜,并让大家吃不上午饭的 Bug。
2、饭点时间,遇到这种事情,也真的糟心了!而且,这种情况还不是个例,在微博上一搜,反映美团外卖这种情况的还真不少。
3、连续尝试付款了好多次,但是钱出去了,却既没有下成单,也没有退款。
4、想找美团外卖的客服咨询情况,但是却一直联系不上,无论是网上客服还是电话客服。
美团方面:
1、事件当日12:16 分美团微博回复:订单问题已修复,订单问题已修复,订单问题已修复。
2、12:28 分 APP 仍然处于宕机状态。下午12:43分,美团在微博上回应:经紧急修复后,现已陆续恢复,重复支付的订单会原路退回,系统故障期间未完成服务的订单,用户可以无责取消退款。
事件结果:
1、部分重复下单的网友已经获得了退款和美团的致歉红包;
2、此次事故对美团的程序员们来说,简直是年度灾难,很可能直接导致美团的程序员们错失丰厚年终奖的机会。
事实上,美团并非第一次出现类似的问题,据了解,12 月 5 日,美团外卖也出现了一次服务器崩溃事故,中午当用户点完餐,想要查看订单进度时,页面要么显示“系统处理异常”,要么是“订单不存在”,使得用户无法追踪自己的餐品配送进度。
网友对结果吐槽:
1、美团的程序员是不是饿了去吃饭了,忽视了系统的 Bug,还是被祭天了?是不是放寒假了?
2、饿了么安插在美团身边的程序员终于发力了。继暴风影音、虾米音乐后,又一程序员要被祭天了。
详细解析美团外卖运维过程中的问题发现、根因分析:
问题发现:业务流程复杂
根因分析:需要解决问题
可总结以下四大主要痛点:
1、公司有多套监控系统,它们有各自的职责定位,但是互相没有关联,所以开发人员在排查问题时需要带着参数在不同的系统之间切换,这就降低了定位问题的效率。
2、事件通知、报警事件充斥着开发人员的 IM,我们需要花很多精力去配置和优化报警阈值、报警等级才不会出现很多误报。
3、开发人员收到各种报警之后,通常都会根据自己的经验进行问题的排查,这些排查经验完全可以标准化。
4、我们的代码中会有大量的降级限流开关,在服务异常时进行相应的保护操作。这些开关随着产品快速地迭代,我们并不能确定它们是否还有效。
针对此次事件你怎么看?
写在最后:
很多人都知道我是学全栈的,都天真的以为我有全套的前端、php等视频学习资料。我想说你们是对的,我的确有前端和php的全套视频资料。
以上资料都是我这些年来自己学习的视频资料,当时花了我可是得有超3万块。放在我这里也没什么用了,虽然偶尔看看也有帮助。这里就免费分享给大家吧,关注公众号:”程序员期刊“。即可回复资料领取。完全免费
领取专属 10元无门槛券
私享最新 技术干货