死锁是指多个进程(线程)因为长久等待已被其他进程占有的的资源而陷入阻塞的一种状态。当等待的资源一直得不到释放,死锁会一直持续下去。...死锁一旦发生,程序本身是解决不了的,只能依靠外部力量使得程序恢复运行,例如重启,开门狗复位等。 所以内核中设计了内核死锁检测机制,一旦发现死锁进程,就重启OS,快刀斩乱麻解决问题。...之所以使用重启招数,还是在于分布式系统中可以容忍单点崩溃,不能容忍单点进程计算异常,否则进行死锁检测重启OS就得不偿失了。
欢迎前来调戏 >> ❝原文链接:https://netflixtechblog.com/debugging-a-fuse-deadlock-in-the-linux-kernel-c75cd7989b6d...本文展示了我是如何查看 /proc 来排查内核问题,并将问题发布到内核邮件列表上,从而更深入地了解内核的等待代码实际上是如何工作的!...(*Runner).startRunner(0xc000432dc0, 0x163bdb8, 0xc00071e0c0, 0xc0a502e28c08b488, 0x24572b8, 0x1df5980...我花了一些时间阅读内核头文件,特别是 include/linux/wait.h。发现 wait_event() 是内核中的一个常见宏,用于实现信号量、等待队列、完成队列等。...虽然本文只讨论了 FUSE 死锁的情况,但在 NFS 代码和其他地方也存在类似问题,虽然目前我们还没有在生产环境中遇到这个情况,但可以肯定将来一定会遇到。
目前Linux内核主线不支持软实时,而是使用下面2个仓库存放和Linux内核主线的版本对应的实时内核的源代码。...(3)如果使用内核线程执行中断处理函数,那么原来禁止硬中断的临界区不需要禁止硬中断,为了兼顾非实时内核和实时内核,引入本地锁,非实时内核把本地锁映射到禁止内核抢占和禁止硬中断,实时内核把本地锁映射到基于实时互斥锁实现的自旋锁...(3)在实时内核中大多数禁止内核抢占的临界区可以变成可抢占的,为了兼顾非实时内核和实时内核,引入本地锁,非实时内核把本地锁映射到禁止内核抢占和禁止硬中断,实时内核把本地锁映射到使用实时互斥锁实现的自旋锁...为了能够合并到内核主线(Linux是通用操作系统,需要满足不同场合的需求),软实时Linux内核采用非常灵活的策略,划分了5种内核抢占模型,如下。...14.参考文档 (1)A realtime preemption overview,https://lwn.net/Articles/146861/,(说明:Linux内核没有完全按照这篇文档实现) (
EPOLL_CTL_DEL EPOLL_CTL_DEL 的实现调用的是 ep_remove 函数,函数只是清除ADD时, 添加的各种结构,EPOLL_CTL_MOD 的实现调用的是ep_modify...,在ep_modify中用新的事件掩码调用f_ops->poll,检测事件是否已可用,如果可用就直接唤醒epoll,这两个的实现与EPOLL_CTL_ADD 类似,代码上比较清晰,这里就不具体分析了。...(pwake) ep_poll_safewake(&ep->poll_wait); return 0; } epoll_wait /* epoll_wait实现...wait_queue_t wait; ktime_t expires, *to = NULL; if (timeout > 0) { // 转换为内核时间...} return eventcnt; } eventpoll_poll 由于epoll自身也是文件系统,其描述符也可以被poll/select/epoll监视,因此需要实现
内核用C语言编写,移植能力很强 进程创建迅速,独特的fork调用 提供了简洁但是稳定的进程间通讯原语 1.2 unix和linux linux克隆unix,但不是unix linux借鉴了unix很多的设计...应用程序通常调用库函数,库函数通过系统调用让内核带其完成各种任务 内核对硬件设备的管理:硬件想要通讯时,发送异步信号去打断内核,内核通过中断号查找处理程序 linux内核开发的特定 不能链接标准c函数库...c库太大了,会影响大小和效率。不过大部分常用的c函数在内核中都有实现 没有内存保护机制,要注意非法访问内存地址 不要轻易使用浮点数,要人工保存和恢复浮点寄存器 栈空间很小且固定。...调度算法 3.1 概述 linux调度程序定义与kernel/sched.c 2.5版本内核重写调度算法,和以前版本区别很大,实现以下目标 充分实现O(1)调度,不管多少进程或什么输入,每个算法能在恒定时间内完成...通常情况下,用户通过包含标准头文件,并和底层系统调用具体的c实现链接,就可以使用系统调用 自定义系统调用在标志头文件中不存在,可以通过linux提供的宏来调用:_syscalln,n代表需要传递的参数
Linux死锁检测 最近遇到了一个驱动上面的BUG,导致终端敲命令都无响应,最终导致内核触发了hung_task_timeout...... 为什么会出现这种情况?该如何排查?...CONFIG_PROVE_LOCKING:允许内核报告死锁问题。...如果这种情况继续存在,将可能导致死锁的情况。 {+.+.}:是用来描述Linux内核中锁的状态的符号,也称作锁的标志位或锁标志。...在 Linux 内核调试中,报告锁状态通常都使用这种简洁的符号,通过观察锁标志位,可以快速地了解内核锁的状态,诊断性能问题和死锁问题。...在Linux内核中,每个锁的释放次数需要与该锁的获取次数相匹配,否则就会出现锁释放不平衡的情况。
从main.c中的printf开始读这个函数。...和NR_BUFFERS*BLOCK_SIZE都为int类型; 以前已经分析过可变参数的一系列实现函数va函数。...我们先不管write函数的实现,首先来看vsprint。...分析同上 而write函数跟fork函数一样是由_syscall*来实现的,内嵌汇编就不多解释了,直接展开就行 write.c _syscall3(int,write,int,fd,const char...(__NR_##name),"b" ((long)(a)),"c" ((long)(b)),"d" ((long)(c))); \ if (__res>=0) \ return (type) _
ECMP在不同版本的Linux内核实现方式不一样,总体上可分为4个阶段。 内核版本ECMP功能< Pre kernel v2.2无ECMP。...在内核中该变量是:“ip_rt_gc_timeout”。...内核的实现的关键变更历史。...时间:1997.11 版本:Pre kernel v2.2 事件:“IPV4 ECMP”实现被加入内核。...时间:2012.9 版本:kernel v3.6 commit 5e9965c15ba8 事件:IPV4路由寻找下一条算法“IPV4 route cache”实现被移除。
文章目录 一、下载 Linux 内核源码 二、使用 VSCode 阅读 Linux 内核源码 一、下载 Linux 内核源码 ---- 参考 【Linux 内核】编译 Linux 内核 ① ( 下载指定版本的...Linux 内核源码 | Linux 内核版本号含义 | 主版本号 | 次版本号 | 小版本号 | 稳定版本 ) 博客 , 下载 Linux 5.6.18 版本的内核源码 ; 5.x 内核源码下载地址...: https://mirrors.edge.kernel.org/pub/linux/kernel/v5.x/ Linux 内核 5.6.18 版本 : https://mirrors.edge.kernel.org...参考 【错误记录】解压 Linux 内核报错 ( Can not create symbolic link : 客户端没有所需的特权 | Windows 中配置 7z 命令行执行解压操作 ) 博客 ;...不同版本的 Linux 内核 区别 : 系统调用 : 其系统调用是相同的 , 新的版本可能会增加新的系统调用 ; 设备文件 : 各内核版本的设备文件都是相同的 , 但是 内部接口 可能不同 ; 二、使用
文章目录 一、下载 Linux 内核源码 二、使用 VSCode 阅读 Linux 内核源码 一、下载 Linux 内核源码 ---- 参考 【Linux 内核】编译 Linux 内核 ① ( 下载指定版本的...Linux 内核源码 | Linux 内核版本号含义 | 主版本号 | 次版本号 | 小版本号 | 稳定版本 ) 博客 , 下载 Linux 5.6.18 版本的内核源码 ; 5.x 内核源码下载地址...: https://mirrors.edge.kernel.org/pub/linux/kernel/v5.x/ Linux 内核 5.6.18 版本 : https://mirrors.edge.kernel.org...不同版本的 Linux 内核 区别 : 系统调用 : 其系统调用是相同的 , 新的版本可能会增加新的系统调用 ; 设备文件 : 各内核版本的设备文件都是相同的 , 但是 内部接口 可能不同 ; 二、使用...按钮 , 此时就可以在 VSCode 中阅读 Linux 内核源码 ;
lockdep是内核提供协助发现死锁问题的功能。 本文首先介绍何为lockdep,然后如何在内核使能lockdep,并简单分析内核lockdep相关代码。...常见的死锁有如下两种: 递归死锁:中断等延迟操作中使用了锁,和外面的锁构成了递归死锁。 AB-BA死锁:多个锁因处理不当而引发死锁,多个内核路径上的所处理顺序不一致也会导致死锁。...Linux内核提供死锁调试模块Lockdep,跟踪每个锁的自身状态和各个锁之间的依赖关系,经过一系列的验证规则来确保锁之间依赖关系是正确的。 2....下面是lockcep内核选项及其解释: CONFIG_DEBUG_RT_MUTEXES=y 检测rt mutex的死锁,并自动报告死锁现场信息。...参考文档 《Linux 死锁检测模块 Lockdep 简介》 内核帮助文档:Documentation/locking/
i2c-tools的相关命令常用于linux系统读写i2c设备寄存器的在线调试。...安装命令: apt-get update apt-get install i2c-tools linux版本代码下载路径: https://mirrors.edge.kernel.org/pub/software... -l i2c-0 i2c rk3x-i2c I2C adapter i2c-1 i2c ...rk3x-i2c I2C adapter i2c-9 i2c DesignWare HDMI ...40: 00 0c 00 0c 00 07 00 01 00 0c 00 00 00 5f 00 03 .?.?.?.?.?..._.?
前言:之前的文章介绍了基于 tracepoint 静态追踪技术的实现,本文再介绍基于 kprobe 的动态追踪即使的实现。同样,动态追踪也是排查问题的利器。...kprobe 是内核提供的动态追踪技术机制,它允许动态安装内核模块的方式安装系统钩子,非常强大。下面先看一个内核中的例子。...#include #include #include #define MAX_SYMBOL_LEN...总结:内核通过劫持的方式实现了 kprobe,基于 kprobe 的动态追踪技术可谓是非常复杂而强大,我们可以利用这个机制,动态修改逻辑,收集信息。...不过实现过于复杂,涉及到对 CPU 架构和内存模型的了解,本文也是大致分析了一下流程,有兴趣的同学可以自行查看源码。
软件死锁:内核在内核模式下循环超过20s (watchdog_thresh*2),没有给其它进程机会去运行。 默认系统保持死锁显示当前堆栈信息。...硬件死锁:CPU在内核模式下循环超过10s(watchdog_thresh)没有给其它中断机会运行则默认系统保持死锁。...hardlockup: 硬锁实现原理 (当前用PMU实现, Performance monitor units性能管理监视单元) 为了使能NMI watchdog, 内核需要支持APIC。...X86 SMP系统内核:APIC已自动编译进内核。...性能监视:可以参考使用命令perf 源码注释:kernel/watchdog.c
epoll实现 epoll 的实现比poll/select 复杂一些,这是因为: 1. epoll_wait, epoll_ctl 的调用完全独立开来,内核需要锁机制对这些操作进行保护,并且需要持久的维护添加到...单个文件的状态改变可能唤醒过多监听在其上的epoll,产生唤醒风暴 epoll各个功能的实现要非常小心面对这些问题,使得复杂度大大增加。...因为ep_call_nested中已经对死循环和过深的递归做了检查,实际的ep_loop_check_proc的实现只是递归调用自己。...epoll的实现中考虑到了此问题,在每次添加新文件到epoll中时,就会首先检查是否会出现这样的唤醒风暴。...epoll_event epds; error = -EFAULT; if (ep_op_has_event(op) && // 复制用户空间数据到内核
epoll实现 epoll 的实现比poll/select 复杂一些,这是因为: 1. epoll_wait, epoll_ctl 的调用完全独立开来,内核需要锁机制对这些操作进行保护,并且需要持久的维护添加到...单个文件的状态改变可能唤醒过多监听在其上的epoll,产生唤醒风暴 epoll各个功能的实现要非常小心面对这些问题,使得复杂度大大增加。...epoll的核心数据结构 // epoll的核心实现对应于一个epoll描述符 struct eventpoll { spinlock_t lock; struct mutex...epoll的实现中,所有可能产生递归调用的函数都由函函数ep_call_nested进行包裹,递归调用过程中出现死循环或递归过深就会打破死循环和递归调用直接返回。...因为ep_call_nested中已经对死循环和过深的递归做了检查,实际的ep_loop_check_proc的实现只是递归调用自己。
linux内核分析———SLAB原理及实现 Slab原理及实现 1. 整体关系图 ! ?...注:SLAB,SLOB,SLUB都是内核提供的分配器,其前端接口都是一致的,其中SLAB是通用的分配器,SLOB针对微小的嵌入式系统,其算法较为简单(最先适配算法),SLUB是面向配备大量物理内存的大规模并行系统...相关函数 3.1 kmem_cache_create (mm/slab.c) /** * kmem_cache_create - Create a cache....kmalloc_sizes.h struct cache_sizes malloc_sizes[] = { #define CACHE(x) { .cs_size = (x) }, #include <linux...c =virt_to_cache(objp);//获得高速缓存 debug_check_no_locks_freed(objp, obj_size(c)); __cache_free(c, (void
而这些方向往往都涉及到底层的东西,所以就自然需要去了解内核提供的一些技术,内核提供的能力,经过多年的发展,可谓是百花齐放,而且非常复杂。本文简单分享一下内核的静态追踪技术的实现。...subsys/file.c #include DEFINE_TRACE(subsys_eventname);void somefct(void){...2 trace event 有了 Tracepoint 机制后,我们就可以写模块加载到内核中实现自己的插桩点。但是内核也为我们内置提供了非常多的插桩点。具体是通过 trace event 来实现的。...我们可以看到插桩的这种机制是一种静态的机制,我们通常需要依赖当前版本的内核所支持的桩,从而获得对应的信息,但其实内核也提供了动态追踪的能力,可以实现热插拔获取信息的能力。...总的来说,Linux 下的追踪技术多种多样,虽然非常复杂,但是上层也提供了各种更方便的工具,这些能力是我们深入排查问题的利器。
net:网络相关代码,实现了各种常见的网络协议。 scripts:包含用于配置内核的脚本文件。 security:主要包含SELinux 模块。...usr:实现了用于打包和压缩的cpio等。 Linux内核的有哪些组成部分?...如何实现从用户空间到内核空间的控制转移? 只能通过系统调用和硬件中断完成 Linux内核的编译及加载 内核的配置系统由哪既部分组成?...记录哪些部分被编译入内核、哪些部分被编译为内核模块。 在Linux 内核中增加程序需要完成哪些工作? 将编写的源代码复制到Linux 内核源代码的相应目录。...Linux下的C 编程 Linux中宏定义、变量名、函数名命名习惯是什么?
领取专属 10元无门槛券
手把手带您无忧上云