首页
学习
活动
专区
工具
TVP
发布

LINUX阅码场

专栏成员
365
文章
790365
阅读量
235
订阅数
高性能计算与性能优化:访存
随便聊聊高性能计算和性能优化,想到哪说到哪。文章分为4个部分,第一个部分聊聊并行算法,第二个部分系统地说一下性能优化的方法论,第三个部分介绍一下性能分析,第四个部分介绍一下小结和感悟。
Linux阅码场
2024-04-19
1520
eBPF动手实践系列三:基于原生libbpf库的eBPF编程改进方案
在上一篇文章《eBPF动手实践系列二:构建基于纯C语言的eBPF项目》中,我们初步实现了脱离内核源码进行纯C语言eBPF项目的构建。libbpf库在早期和内核源码结合的比较紧密,如今的libbpf库更加成熟,已经完全脱离内核源码独立发展。
Linux阅码场
2024-03-20
1990
以太网存储网络的拥塞管理连载(六)
本文节选自《DetectingTroubleshooting, and PreventingCongestion in Storage Networks 存储网络中拥塞处理》
Linux阅码场
2024-03-07
1780
以太网存储网络的拥塞管理连载(四)
本文节选自《DetectingTroubleshooting, and PreventingCongestion in Storage Networks 存储网络中拥塞处理》
Linux阅码场
2024-02-29
1550
Linux内核中的各种锁:信号量/互斥锁/读写锁/原子锁/自旋锁/内存屏障等
既然是锁CPU,那就都是针对多核处理器或多CPU处理器。单核的话,只有发生中断会使任务被抢占,那么可以进入临界区之前先关中断,但是对多核CPU光关中断就不够了,因为对当前CPU关了中断只能使得当前CPU不会运行其它要进入临界区的程序,但其它CPU还是可能执行进入临界区的程序。
Linux阅码场
2024-02-21
4310
谢宝友:深入理解RCU之六:分级RCU基础
本文基于linux 2.6.32-rc7版本的源码, 因此请准备一份linux2.6.32-rc7代码。建议用如下两种方法获取源代码:
Linux阅码场
2023-12-28
4630
深入理解Linux进程间通信
程磊,某手机大厂系统开发工程师,阅码场荣誉总编辑,最大的爱好是钻研Linux内核基本原理。 一、进程间通信的本质
Linux阅码场
2023-11-20
4230
从多核到众核处理器
其实“多核”这个词已经流行很多年了,世界上第一款商用的非嵌入式多核处理器是2002年IBM推出的POWER4。当然,多核这个词汇的流行主要归功与AMD和Intel的广告,Intel与AMD的真假四核之争,以及如今的电脑芯片市场上全是多核处理器的事实。接下来,学术界的研究人员开始讨论未来成百上千核的处理器了。有一个与多核匹配的词叫片上网络(Networks on Chip),讲的是多核里的网络式互连结构,甚至有人预测未来将互连网集成到片上这种概念了。当然,这样的名词是很吸引眼球的,不过什么东西都得从实际出发,这篇文章也就简单地分析了为什么有多核这个事情,以及多核系统的挑战。
Linux阅码场
2023-11-16
3000
生成式AI会帮助还是会伤害嵌入式软件开发人员
编者按:本文编译自eetimes,作者Semir Haddad是MicroEJ的首席产品官。
Linux阅码场
2023-10-24
2970
LWN:新的容器文件系统PuzzleFS!
差不多去年的时候,发布了一些旨在支持容器工作负载(container workload)的新文件系统类型。PuzzleFS是Ariel Miculas在2023年Kangrejos聚会上提出的一个新的选手,但它具有一些自己的特点,包括一种新颖的压缩机制和使用Rust编写的实现。
Linux阅码场
2023-10-17
2400
PCIe 课程典型问题解答
1.CPU 发起的,访问PCIe设备配置空间的数据流。这种数据流主要是BIOS/Linux PCIe driver 对设备进行初始化、资源分配时,读写配置空间的。包括PCIe 枚举,BAR 空间分配, MSI 分配等。 设备驱动通过 pci_wirte_config() / pci_read_config() 发起配置空间访问。 lspci / setpci 也是对应到配置空间访问。
Linux阅码场
2023-09-22
7780
LWN:把软中断锁放到更底层去!
大内核锁(BKL)现在已经成为了一个遥远的记忆,但在那么多年里,它都是内核开发社区面临的一项棘手问题。然而 BKL 的终结并不意味着内核没有其他有问题的锁。近来,已经有一些关注转向了软中断锁(software-interrupt lock)或“下半部锁”(bottom half lock),因为它可能会在实时系统上导致延迟。Frederic Weisbecker 正在采取最新行动来减小这个锁的影响范围,该方法就是基于移除 BKL 时所采取的方法。
Linux阅码场
2023-09-11
1840
LWN:快速、低开销的堆栈跟踪工具SFrame!
获取运行中程序的 stack trace 在很多场景下都非常有用:跟踪(tracing)、性能分析(profiling)、调试、性能优化等。虽然已经有了一些机制可以获取 stack trace,但它们存在一些缺点。于是"Simple Frame"(SFrame) stack trace 格式应运而生,希望解决其他技术的不足之处。今年五月,Steve Rostedt 和 Indu Bhagat 在 LSFMM+BPF 活动中就内核中的 SFrame 支持进行了演讲;几天后,Bhagat 在温哥华的北美开源峰会上做了一个更加全面的关于 SFrame 的演讲(YouTube 上有视频)。第二个演讲可以帮助了解 SFrame 和整体 stack trace 的其他方面。
Linux阅码场
2023-09-11
2250
GPU功耗管理方式介绍(Linux)
Management PCI-Express Runtime D3 (RTD3) Power Management是一种用于管理PCI-Express设备的低功耗模式的技术RTD3是一种睡眠状态,当PCI-Express设备处于空闲状态时,可以将其置于低功耗模式,以减少能源消耗和热量产生。英伟达™(NVIDIA®)图形处理器有许多省电机制。其中一些机制会降低芯片不同部分的时钟和电压,在某些情况下还会完全关闭芯片部分的时钟或电源,但不会影响功能或继续运行,只是速度较慢。然而,英伟达™(NVIDIA®)GPU 的最低能耗状态需要关闭整个芯片的电源,通常是通过调用 ACPI 来实现。这显然会影响功能。在关机状态下,GPU 无法运行任何功能。必须注意的是,只有在 GPU 上没有运行任何工作负载的情况下才能进入这种状态,而且在试图开始工作或进行任何内存映射 I/O (MMIO) 访问之前,必须先重新开启 GPU 并恢复任何必要的状态。
Linux阅码场
2023-08-21
1.7K0
kprobe 和 kretprobe 隐藏的秘密
Linux kernel 的 kretprobe 机制和 kprobe 完全不同,本质原因在于,函数的入口地址是固定的,但函数的返回地址不固定,由于返回位置不固定,无法固定函数大小,无法事先插桩。一图以示之:
Linux阅码场
2023-08-21
3380
RAS(四)Intel MCA-Uncorrected Recoverable
Recovery of uncorrected recoverable(UCR) errors是MCA的一个增强特性,它针对部分硬件无法恢复的故障,提供软件隔离、恢复的机会。UCR errors表示硬件已检测到错误并发出信号通知到软件,软件执行了某些恢复操作(不会出现错误污染、扩散)后,系统可以继续运行。
Linux阅码场
2023-08-21
4690
RAS(三)Intel MCA-CMCI
Corrected machine-check error interrupt (CMCI)是MCA的增强特性,它提供了一种threshold-based的错误上报方式。这种模式下,软件可以配置硬件corrected MC errors的阈值,硬件发生CE(Corrected Error)次数达到阈值后,会产生一个中断通知到软件处理。
Linux阅码场
2023-08-21
4220
RAS(二)Intel MCA初探
谈到当前业界使用最广泛、最好的RAS商用解决方案,那么必定是Intel公司。从广泛上来说,大部分公司使用的x86服务器,首选Intel;从RAS能力来说,Intel CPU的MCA架构,从故障检测、故障上报、故障恢复等层面功能都非常完善。所以笔者认为,想要学习Linux RAS,那么Intel CPU手册中MACHINE-CHECK ARCHITECTURE章节和对应的Linux arch/x86/kernel/cpu/mce目录相关代码将是非常好的入门学习资料。
Linux阅码场
2023-08-21
7420
RAS(一)介绍
近期收到了公司大礼包,想着在找工作期间把Linux RAS整理一下,写成系列文章。毕竟作为OS RAS负责人兼开发,为阿里云X86和倚天710 RAS落地了很多RAS增强和解决方案,对阿里云服务器稳定性做出些许贡献。期间也有不少其他团队过来请教过RAS事项,所以想着记录下来,对以后计划了解和学习RAS的Linux爱好者有所帮助。另外个人视角主要从Linux内核出发,梳理Linux RAS涉及的组件、功能、特性都有哪些,也会介绍内核RAS涉及的硬件。
Linux阅码场
2023-08-21
8580
塑造嵌入式AI的四个新趋势
1/在过去的几年里,嵌入式计算机视觉以及更广泛的感知人工智能取得了巨大的增长:使用传感器和嵌入式人工智能来帮助机器感知和理解周围的现实世界。嵌入式视觉和感知 AI 使系统比以往更强大、更易于使用、更高效、更有能力。是什么推动了这一趋势?正在解决什么问题?通过调研专注相关领域上百家公司,我们将一些洞察总结下来。
Linux阅码场
2023-08-21
3930
点击加载更多
社区活动
AI代码助手快速上手训练营
鹅厂大牛带你玩转AI智能结对编程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档