只有很多的日志信息和高级别的告警并不会给你与这个问题根因真正相关的答案.
为了远离这种场景, 真正的「证据」应该是什么? 你应该问什么问题?
是一个用户抱怨还是所有用户都受影响?...如果客户使用加载缓慢、体验很差,应用响应时间很慢, 第一个问题应该是是否与糟糕的代码有关. 你需要分析代码级别的性能热点来找到是否原因是低效的算法还是缺乏代码和架构的最佳实践....如果虚拟机(如:VMware, EC2...)或你的容器(Docker)或你的中间件或你的应用运行时(如:tomcat)没有正确的 size, 或者和其他虚拟机及容器存在资源争用也可能引起性能问题....是应用服务器的问题么?
因为不正确的配置或错误的部署, 应用服务器也可能是性能问题的原因. 正确的资源池(线程, 数据源等)大小, 安全配置或日志参数都会影响性能....总结
How What Who Why
有了这些问题的答案, 你可以消除作战室, 迅速定位问题根源, 优化并找到解决方案.