首页
学习
活动
专区
工具
TVP
发布

笔记+

个人工作/学习笔记
专栏作者
43
文章
101819
阅读量
25
订阅数
为什么会出现cpu使用率偶数核比奇数核高
偶有云上用户反馈云主机cpu使用率偶数核比奇数核高的现象,比如cpu0高,cpu1低,cpu2高,cpu3低依次循环,这里的原因是开启超线程后一个物理core包含两个超线程,比如vcpu0/vcpu1是一个物理core的两个超线程,vcpu2/vcpu3也是一个物理core的两个超线程,抛开cpu wake_affine因素,linux内核在调度选核时如果有空闲的物理core会优先选择两个超线程都是空闲的物理core来运行进程以实现core间负载均衡,如果没有空闲的物理core也会选择最空闲的调度组。以此问题为引本文尝试分析下linux内核的调度选核策略,文中涉及的实验软硬件环境基于tencentos 5.4内核和Intel x86服务器。
cdh
2024-04-22
2090
搭建centos7 ebpf编译环境
安装的是 devtoolset-7 和 devtoolset-8, 安装完成后全部文件在/opt/rh目录下:
cdh
2024-01-03
5130
linux内核nfs rpc task处理分析
本文以centos7 3.10.0-957.21.3.el7.x86_64内核为例介绍linux内核nfs v4.0 处理状态为RPC_TASK_ASYNC的async rpc task的工作机制。
cdh
2023-12-20
2470
如何找出正在访问pvc挂载点的容器进程
如果一个pod在被销毁时其pvc挂载节点无法解挂会导致pod一直处于Terminating状态无法删除,出现这种情况时在系统/var/log/messages搜索pod 的uid能找到到umount对应pvc报Resouce busy。
cdh
2023-11-21
3430
容器内运行bcc-tools方法
wget https://github.com/containerd/nerdctl/releases/download/v1.7.0/nerdctl-1.7.0-linux-amd64.tar.gz
cdh
2023-11-14
2510
container_cpu_load_average_10s是如何统计的
有业务反馈监控基于container_cpu_load_average_10s监控指标在无业务流量的pod统计到的值一直在0-1之间波动,想了解下这里的原因,监控的计算公式为:max by (pod) (container_cpu_load_average_10s{container!="",container!~"sandbox|logrotate|sidecar",pod=~"$pod", container=~"$container"}) / 1000 / max by (pod) (kube_pod_container_resource_limits_cpu_cores{container!="",container!~"sandbox|logrotate|sidecar",pod=~"$pod", container=~"$container"})
cdh
2023-09-15
5020
tracepoint类型的ebpf程序是如何被执行的
本文基于libbpf实现的ebpf例子介绍tracepoint类型ebpf程序调用流程,内核实现以5.4版本为例进行介绍。
cdh
2023-09-11
9910
为什么无法用SIGTERM终止容器1号进程
kubernetes官网资料介绍在停止一个pod时会先发送SIGTERM给Pod各个容器的1号进程实现优雅退出,实际使用容器时会有用户没有关注到如果容器1号进程执行的程序或者脚本如果缺少注册SIGTERM信号handler会导致容器无法优雅退出,直到terminationGracePeriodSeconds时间到达后发送SIGKILL强制杀掉尚未退出的容器。这篇文章从内核实现机制分析为什么容器1号进程不注册SIGTERM信号handler会导致无法优雅停止容器。
cdh
2023-08-11
5270
lsof看到sock fd但是netstat查看不到socket连接的场景
应用程序创建了socket,但是当作为client端时没有调用connect去连接server端:
cdh
2023-06-07
6280
内存lru file比cache大的一种场景介绍
在定位一个线上问题时发现Active(file)+Inactive(file)要比cached统计值大很多,看起来不太符合预期,正常情况下Active(file)+Inactive(file)的统计值都会同时计算到cached里,也就是一般cached的值会比Active(file)+Inactive(file)要大。
cdh
2023-04-28
6740
利用perf统计每个cpu每秒收包数
perf record -e 'net:netif_receive_skb' -aR sleep 1
cdh
2022-05-11
4620
centos7 cgroup oom触发ext4文件系统bug
本文分析过程中参考借鉴了博客:https://cloud.tencent.com/developer/article/1782057的一些知识点,针对自己碰到的实际问题分析过程中补充了一些问题点的理解分析。
cdh
2022-04-15
2.1K1
centos环境解析ubuntu vmcore小技巧
mv linux-image-4.15.0-118-generic-dbgsym_4.15.0-118.119_amd64.ddeb linux-image-4.15.0-118-generic-dbgsym_4.15.0-118.119_amd64.deb
cdh
2022-04-15
7150
scapy构造任意包实例
1. 10.20.0.5运行server.pyq启动一个监听端口为7000的tcp server端
cdh
2022-04-13
1.8K0
结合coredump分析dirty page和IO request处理逻辑(下)
本文接上文"结合coredump分析dirty page和IO request处理逻辑(上)"
cdh
2022-01-05
9700
结合coredump分析dirty page和IO request处理逻辑(上)
从coredump堆栈信息可以很快找出触发进程20223是因为等待被进程1633持有的write rwsem而触发的系统hung task panic:
cdh
2022-01-05
1.9K1
ubuntu changelog/source获取方法
平时使用Ubuntu比较少,相关操作不甚熟悉,对ubuntu查看内核修复信息的一些方法做下记录
cdh
2020-08-11
1.1K0
linux OOM处理机制
当系统内存不足时,Linux内核会触发OOM来选择一些进程kill掉,以便能回收一些内存,尽量继续保持系统继续运行。具体选择哪个进程杀掉,这有一套算分的策略,参考因子是进程占用的内存数,进程页表占用的内存数等,oom_score_adj的值越小,进程得分越少,也就越难被杀掉,oom_score_adj的取值为[-1000,1000]
cdh
2020-07-02
2.5K0
从一个softlock问题来谈谈Kernel IPI的实现
X86-64 架构,Kernel Ver:Centos7 3.10.0-693.el7.x86_64
cdh
2020-06-21
4.8K3
crash工具分析一个IO hung panic实例
[519966.887618] INFO: task java:56149 blocked for more than 120 seconds.
cdh
2020-06-16
3.7K1
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战,赢鹅厂证书、公仔好礼!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档