首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

深度复盘-重启 etcd 引发异常

Serverless 产品上,Master 组件部署在我们metacluster 中(K8s in K8s),超大集群可能有10多个 APIServer,etcd 由服务化的 etcd 平台提供,APIServer 访问...随后又回到 APIServer,一个在请求在 APIServer 内部经历的各个核心阶段(如下图所示): ● 鉴权 (校验用户 token、证书是否正确) ● 审计 ● 授权 (检查是否用户是否有权限访问对应资源...资源的 Get 和 list 5XX 错误,聚集在其中一个实例 ● 通过 APIServer Metrics 视图和 trace 日志排除 webhook 导致的超时等 ● 基于 APIServer 访问...Metrics、Trace 日志确定了是 storage/etcd 模块耗时很长,但是只有一个 APIServer 实例、某类资源有问题 那为什么 etcd 侧看到的监控延时很低,而 APIServer 访问...通过此案例,更让我们深刻体会到,永远要对现网生产环境保持敬畏之心,任何操作都可能会引发不可预知的风险,监控系统不仅要检测变更服务核心指标,更要对主调方的核心指标进行深入检测。

1.4K20

线上数据异常引发的崩溃排查记录

线上数据异常的崩溃,最大的关键是还原线上数据 一个崩溃的引申 最新版本,线上报了一个崩溃,崩溃堆栈如下 Caused by: java.util.NoSuchElementException: Collection...android.view.ViewRootImpl.doTraversal(ViewRootImpl.java:2112) 很显然,这个是混淆后的崩溃,我们用对应的mapping文件排查,定位到了异常的代码如下...matching the predicate,说明用ladderPriceList.first方法,返回的结果是null而导致的崩溃 做了下前后的代码排查,正常情况下是不会出现这个情况的,于是怀疑是接口返回的数据异常...time desc; 已知崩溃的时间是2021-09-13 09:38:13,查找对应崩溃时间的上报记录 定位到了跟崩溃吻合的上报事件,并且也有上报商品的id,所以知道了具体哪个商品导致的崩溃了 排查异常数据...知道某个商品有异常后,模拟请求该商品数据,发现该商品返回的阶梯价逻辑上不合理,最大购买数量超过了跟阶梯价最大量 问题得以定位,接下来跟后端伙伴反馈该问题,等后端修复上线后,可以线上直接修复该问题,

64820

Tomcat配置域名、ip访问及解决80端口冲突

域名可以访问ip无法访问 在Tomcat下面配置域名(如:www.zjhuiwan.com)的时候,同时又不希望客户通过我们网站的IP或者域名访问到Tomcat默认的ROOT,配制方法如下: 2、在server.xml...5、最终我们要在本地访问域名,因无域名解析服务器,所以在hosts上配,来模拟dns解析。...WINDOWS/system32/drivers/etc/hosts 加上 127.0.0.1       www.zjhuiwan.com (注意:去掉“#”) 6、启动Tomcat服务器,就可以直接敲入域名访问你要访问的地址了...II.问题描述: 80端口是一个最为频繁访问的端口号,甚为程序员开发更是经常遇到,比如我们最熟悉的数据库系统服务进程就是默认访问该端口的,还有比如Ngnix服务器默认端口也是80,所以当使用ngnix...时发生端口号冲突了,应该怎么办呢?

5.1K10
领券