我正在寻找一个指标来跟踪我们微服务中某些错误的严重程度。
例如针对外部服务读取超时。在x轴上,我可能会有时间间隔,比如每10分钟。Y轴上的度量值。
一开始,我认为这个值应该是超时请求的数量。但这并不是完全正确的,因为需要将超时次数与总请求数进行比较。
第二,我认为超时请求的百分比。但这也不是完美的,因为如果在此间隔期间请求总数为1,那么100%超时的峰值将不是关键。
我确信这是日志记录和性能指标可视化中的常见场景。
https://stackoverflow.com/questions/55323442
复制相似问题