专栏首页院长运维开发K8S内核故障[内核BUG]

K8S内核故障[内核BUG]

经过测试触发OOM问题

测试:3.10.0-862.3.2.el7.x86_64(内核)

开启7个异常会触发OOM的节点,在一个NODE上,经过测试发现,3.10内核,是并行创建了7个任务,同时触发oom,导致内核锁耗死。测试 2-3分钟内,服务器会死掉,模拟测试连续触发OOM问题直到CPU耗尽。服务器自动重启

kernel: BUG: soft lockup - CPU#4 stuck for 22s! [handler20:1542] 此类也是3.10内核BUG

k8s已经无法管理node节点 ,node节点pod节点全挂了

调整内核 4.1.19,测试触发OOM问题 开启7个异常会触发OOM的节点,在一个NODE上 测试:4.19.1-1.el7.elrepo.x86_64(内核) 测试发现,4.19内核创建任务,非并向,暂时无法触发内核锁BUG。

总结:暂时灰度部分服务器升级内核到4.1.19。后续补充 升级内核操作

自定义内核

下面链接可以下载到其他归档版本的

ubuntuhttp://kernel.ubuntu.com/~kernel-ppa/mainline/ RHELhttp://mirror.rc.usf.edu/compute_lock/elrepo/kernel/el7/x86_64/RPMS/ 官方内核库 https://cdn.kernel.org 下面是ml的内核和上面归档内核版本任选其一的安装方法

自选版本内核安装方法

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • OpenStack命令查看卷快照信息

    院长技术
  • 远程连接提示:两台计算机无法在分配的时间内连接解决方法

    最近西西在使用远程桌面连接的时候发生了连接失败的问题,每次连接都会弹出“两台计算机无法在分配的时间内连接”的问题,在此之前连接远程桌面一直都没出问题,直到某天突...

    院长技术
  • Kubernetes分析ExitCode

    问题 最近总有开发小伙伴来找我,为什么我的容器总退出呢,在哪能看到原因。故写篇文章整理下docker退出的状态码。

    院长技术
  • 重学css3(概览)

    浏览器内核又可以分成两部分:渲染引擎(layout engineer或者Rendering Engine)和JS引擎。

    IT人一直在路上
  • 英特尔曝出重大安全漏洞:亚马逊、微软等众多云服务受影响

    该漏洞存在于英特尔的 x86 硬件之中,无法通过微码升级来解决,必须在系统层面通过安装软件、或者购买没有设计缺陷的新处理器来解决——所以包括苹果 64 位 ma...

    BestSDK
  • centos yum update只升级软件不升级内核

    CentOS升级软件时不升级内核的命令如下 CentOS7.5/7.6 yum update --exclude "kmod-kvdo*,kernel*,cen...

    我爱你的一诺
  • 用户态/内核态、用户栈/内核栈

    内核态就是拥有资源多的状态,或者说访问资源多的状态,也称为特权态。相对来说,用户态就是非特权态,访问的而资源将受到限制。如果一个程序运行在特权态,该程序就可以访...

    233333
  • linux内核态和用户态小结

    当进程执行系统调用而陷入内核代码中执行时,我们就称进程处于内核状态。此时处理器处于特权级最高的(0级)内核代码。当进程处于内核态时,执行的内核代码会使用当前的内...

    ydymz
  • 聊聊运维应该了解的一些内核知识

    本文主要是《Linux内核设计与实现》这本书的读书笔记,这本书我读了不下十遍,但依然感觉囫囵吞枣。我结合自己的理解,从这本书中整理出了一些运维应该了解的内核知识...

    力哥聊运维与云计算
  • Linux 的启动流程

    本篇的重点是讲解设备和驱动的启动流程,设备和驱动的流程是整个内核启动的核心,也是工作中最常面对的问题。出于知识点的系统性考虑,在进入主题之前我们先看下整个 Li...

    刘盼

扫码关注云+社区

领取腾讯云代金券