linux var crash_oom linux crash_jvm crash linux - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Linux crash分析简明参考

Linux操作系统在作为服务器的场景下应用最为广泛,但是在使用过程中也会遇到莫名崩溃的情况.这时我们就希望能对崩溃前一刻内存中的数据进行分析,从而找到崩溃的原因.本文将对整个过程所涉及到的技术做一个简单但是全面的介绍,包括:如何安装kdump,如何设置系统参数来捕获崩溃前的内存;如何使用crash做简单的分析;并且介绍如何使用更加简便的工具PyKdump来做crash文件的分析.通过了解这些知识, 可以帮助Linux运维人员更快更方便地排查问题.

00

AVA进程突然消失的原因?

Linux 内核有个机制叫OOM killer（Out-Of-Memory killer），该机制会监控那些占用内存过大，尤其是瞬间很快消耗大量内存的进程，为了防止内存耗尽而内核会把该进程杀掉。

02

您找到你想要的搜索结果了吗？

是的

没有找到

面试官:哪些原因会导致JAVA进程退出?

值此七夕佳节，烟哥放弃了无数妹纸的邀约，坐在电脑面前码字，就是为了给读者带来新的知识，这是一件伟大的事业！好吧，实际情况是没人约。为了化解尴尬，我决定卖力写文章，嗯，一定是我过于屌丝！好了，开始说重点。今天讲的这个问题

02

怎样配置Linux分析工具：kdump篇

在运维的世界里，服务器的稳定运行是生命的灯塔，一旦遭遇异常重启，便是暴风雨来临的预兆。作为一名运维工程师，深知在这场与故障斗争的战役中，武器的锋利至关重要。今天，我要介绍的主角/工具——kdump，正是这样一款能在风雨来临之际，为我们捕获那一闪而过的真相的工具。

01

某次压测时物理内存被用光 Tomcat 被 Kernel kill 掉的案例

背景描述某项目结构图如下(前端交互式体验及对象存储为主，Redis 及 rds 负载较小没有画出)： web1 和 web2 是两个 Apache，publisher1 和 publisher2 是

07

【教你搭建服务器系列】（6）如何判断服务器被入侵

虽然你的网站是可以运行了，但想要网站 7*24 小时高可用不掉线，还远远不够，因为互联网还有一个看不见的手——入侵者。

01

设置RemoveIPC=yes会crash掉Oracle asm 实例和Oracle database实例

【翻译自mos文章】设置了RemoveIPC=yes 的RHEL7.2上会crash掉Oracle asm 实例和Oracle database实例

04

Linux: 深入探讨KDUMP，内核崩溃调试利器

KDUMP是Linux内核中的一项关键功能，用于在系统崩溃时生成内存转储（core dump）。这对于系统管理员和开发人员来说，分析和调试系统崩溃问题至关重要。本文将详细介绍KDUMP的工作原理、配置方法以及在实际操作中的应用。

02

10.34 linux系统日志

linux系统日志 /var/log/messages //是linux系统一个总的日志——>除非某些服务，有定义单独的日志 /etc/logrotate.conf 日志切割配置文件参考日志文件文章 dmesg命令 /var/log/dmesg 日志 last命令，调用的文件/var/log/wtmp lastb命令查看登录失败的用户，对应的文件时/var/log/btmp /var/log/secure 系统日志 /var/log/messages //是linux系统一个总

06

linux系统奔溃之vmcore：kdump 的亲密战友 crash

crash 是目前广泛使用的 linux 内核崩溃转储文件的分析工具，掌握 crash 的使用技巧，对于分析定位内核崩溃的问题，有着非常重要的作用。本文首先介绍了 crash 的基本概念和安装方法，其次详细介绍了如何使用 crash 工具分析内核崩溃转储文件，包括各种常用调试命令的使用方法，最后以几个实际工作中遇到的真实案例向读者展示了 crash 的强大功能。在这篇文章中，既有详细的工具使用方法，又有丰富的实际案例分析，相信您读过以后定会受益匪浅。

02

实例演示 | 用Kdump分析内核奔溃原因

本文主要介绍kdump服务和crash的使用，并结合一个简单的实例演示如何分析内核奔溃的原因。本文基于linux kernel 4.19, 体系结构为aarch64。 kdump概述 kdump kdump 是一种先进的基于 kexec 的内核崩溃转储机制，用来捕获kernel crash（内核崩溃）的时候产生的crash dump。当内核产生错误时，kdump会将内存导出为vmcore保存到磁盘。 kdump流程当系统崩溃时，kdump 使用 kexec 启动到第二个内核。第二个内核通常叫做捕获内核，以

03

开始在ubuntu下工作

家里的PC机有几个月没用了,昨天刚开机,发现SSD识别不了,经过排查,确定是盘坏了,然后只能重装

01

Golang程序调试常用方法

一般来说，项目开发过程中，代码编写占开发总时间的40%，剩下的时间基本就是自测和联调的过程。程序出错很正常，关键是如何迅速的去定位它，修掉它。本文将介绍自己程序调试的一些常用方法，这边我以golang为例，总结为望问切闻---debug四部曲。

01

Linux Kdump 机制详解

作者简介：中年码农，做过电信、手机、安全、芯片等行业，靠Linux混饭吃。简介 Kdump 提供了一种机制在内核出现故障的时候把系统的所有内存信息和寄存器信息 dump 出来成一个文件，后续通过 gdb/crash 等工具进行分析和调试。和用户态程序的 coredump 机制类似。它的主要流程如下图所示：可以看到它的核心原理是保留一段内存并且预先加载了一个备用的 kernel，在主 kernel 出现故障时跳转到备用 kernel，在备用 kernel 中把主 kernel 使用的内存和发生故障时的寄

02

RabbitMQ 监控6

在Linux中cookie的位置一般在 /var/lib/rabbitmq/.erlang.cookie

02

Atom-Shell 入门

现在已经有很多框架可以让我们用JavaScript、HTML和CSS来编写跨平台桌面应用，Atom Shell便是其中之一。Atom Shell基于nodejs和Chromium实现，Github的开源编辑器Atom便是基于Atom shell和Coffee scrpit开发的。

03

解决Linux内核问题实用技巧之 - Crash工具结合/dev/mem任意修改内存

解决每一类问题都需要消耗大量的时间，特别是重新编译内核这种事情。于是，每一个Linux内核程序员或多或少都会掌握一些Hack技巧，以节省时间提高工作效率。

06

当 Swift 中的 lazy、weak 碰上 NSObject

今天给大家介绍一个我遇到的小坑。过程大概是这样的，一个复用页面通过不同的入口进入，等返回时，有的正常，有的却出现了 Crash，log 信息如下。

04

学习笔记0420----文件同步工具-rsync

Linux系统下有很多数据备份工具，常用的是rsync，从字面意思理解为remote sync （远程同步）． rsync不仅可以远程同步数据（类似于scp），而且可以本地同步数据（类似于cp），但不同于cp或者scp的一点是，它不会覆盖以前的数据（如果数据已经存在），而是先判断已经存在的数据和新数据的差异，只有数据不同时才会把不相同的部分覆盖。

03

Linux内核分析：页回收导致的cpu load瞬间飙高的问题分析与思考

本文一是为了讨论在Linux系统出现问题时我们能够借助哪些工具去协助分析，二是讨论出现问题时大致的可能点以及思路，三是希望能给应用层开发团队介绍一些Linux内核机制从而选择更合适的使用策略。

02

Lnux系统主目录结构及其作用

Linux和UNIX的文件系统是一个以“/ “为根的阶层式的树状文件结构，/ 因此被称为根目录。所有的文件和目录都置于根目录/ 之下。根目录/下面有/bin，/home，/usr等子目录。在早期的UNIX系统中，各个厂家各自定义了自己的UNIX系统的文件系统构成，比较混乱。

02

日志轮转

日志重要性 Linux系统日志对管理员来说，是了解系统运行的主要途径，因此需要对 Linux 日志系统有个详细的了解。 Linux 系统内核和许多程序会产生各种错误信息、告警信息和其他的提示信息，这些各种信息都应该记录到日志文件中，完成这个过程的程序就是 rsyslog，rsyslog 可以根据日志的类别和优先级将日志保存到不同的文件中。二、日志系统rsyslog 日志管理基础 rsyslog 日志管理 logrotate日志轮转一、处理日志的进程 rsyslogd：绝大部分日志记录，和系统操作

02

Android JNI Crash定位步骤

今天讲的是纯干货，目的就是为了指导Android开发者如何根据JNI Crash日志顺藤摸瓜，最后直捣黄龙定位磨人的JNI Crash。所以废话不多，直接开干吧。

01

翻译| 如何排查MySQL 内存泄漏

对crash的数据库进行故障分析并不是一件快乐的事情，尤其是 MySQL 的日志中没有提供 crash 原因的情形。比如当 MySQL 内存耗尽。在 2012年 Peter Zaitsev 写了一篇文章分析MySQL如何使用内存

02

用 Puppeteer 实现一个自动化机器人

Puppeteer 是 Node.js 的一个函数库，可用来操控浏览器，是 Google 的项目，可以应用的范围包括：前端的自动化测试、爬虫、表单提交等。

03

从一个softlock问题来谈谈Kernel IPI的实现

X86-64 架构，Kernel Ver：Centos7 3.10.0-693.el7.x86_64

Linux kernel 调试方法总结

本文旨在介绍下几种常见的调试方法gdb、crash、kgdb and kdb 以及dynamic debug. 关于在 Linux 内核上使用debuggers，Linus Torvalds 长期以来对它们不太喜欢。简短地解释这种态度是，依赖调试器可能鼓励用权宜之计而非深思熟虑来解决问题，这会导致代码质量恶化。详细解释可以参考https://lwn.net/2000/0914/a/lt-debugger.php3

00

靶场测试Writeup编写框架

Introduction What is the environment of the target ? What kind of technology is needed for the attac

03

redhat5.0从无到有安装xen虚拟机

实验室有节点node1和node2，现在想在节点上安装xen虚拟机，node1上安装VM1、VM2，node2上安装VM3和VM4。配置之后，VM1、VM2、VM3、VM4之间可以相互通信。效果如下图所示

01

[linux][kernel]虚拟机场景中获取Guest OS的log

前言： GuestOS中如果发生了一些错误，GuestOS还活着，shell已经hung住了，如何获取到GuestOS中的关键log信息呢？分析： 1，keyboard interrupt QE

基于云开发开发 Web 应用（四）：引入统计及 Crash 收集

在完成了产品的基础开发以后，接下来需要进行一些周边的工作，这些周边工具将会帮助下一步优化产品。

02

美团一面：为什么线程崩溃崩溃不会导致 JVM 崩溃

网上看到一个很有意思的美团面试题：为什么线程崩溃崩溃不会导致 JVM 崩溃，这个问题我看了不少回答，但发现都没答到根上，所以决定答一答，相信大家看完肯定会有收获，本文分以下几节来探讨

02

centos环境解析ubuntu vmcore小技巧

mv linux-image-4.15.0-118-generic-dbgsym_4.15.0-118.119_amd64.ddeb linux-image-4.15.0-118-generic-dbgsym_4.15.0-118.119_amd64.deb

04

linux 、kernel 虚拟机场景中获取 Guest OS 的 log

01

Breakpad跨平台crash捕获和生成工具使用

breakpad是一组用于实现崩溃报告系统的客户端和服务器组件。Chromium的Breakpad是目前Native崩溃捕获中最成熟的方案。它是一套完整的工具集，从Crash的捕获到Crash的dump，都提供了相对应的工具。它记录了崩溃时的.dump文件，无论我们是在本地或者发送到服务器端，都可以用相对应的工具来解析.dump文件帮助我们查找C和C++堆栈踪迹。

04

音视频开发之旅（59)- 捕获收集、定位分析 Native崩溃

我们知道Java崩溃是在Java代码中出现了未捕获异常，导致程序异常退出，常见的异常有：NPE、OOM、ArrayIndexOutOfBoundsException、IllegalStateException、ConcurrentModificationException等等。还有一类崩溃，也是我们不得不关注，那就是Native层崩溃，这类崩溃不像Java层崩溃那样比较清晰的看出堆栈信息以及具体的崩溃。每当遇到是都要查找分析，写这篇的目的是帮助自己做下记录，也希望能帮到有类似困扰的你，下面我们开始一起学习实践吧。本文学习实践的demo以张绍文《Android开发高手课》中的例子进行。

04

如何在一个Docker中同时运行多个程序进程?

那么基本思路是在Dockerfile 的CMD 或者 ENTRYPOINT 运行一个”东西”,然后再让这个”东西”运行多个其他进程简单说来是用Bash Shell脚本或者三方进程守护 (Monit,Skaware S6,Supervisor),其他没讲到的三方进程守护工具同理

03

5分钟入门 redis 命令行

redis 的 windows 客户端实在难用，这次连不上还 crash 了 N 次，还是转命令行吧。搜出来的教程都是杂七杂八，不适合我这种菜鸡。

01

5分钟入门 redis 命令行

redis 的 windows 客户端实在难用，这次连不上还 crash 了 N 次，还是转命令行吧。搜出来的教程都是杂七杂八，不适合我这种菜鸡。

02

【Node.js】一个愚蠢的Try Catch过错

08

使用addr2line分析Native Crash

在Android NDK开发中，Native层的崩溃信息不像Java层的崩溃堆栈那样可以直接看到出现问题的函数名和行数

01

Android基础开发实践：如何分析Native Crash

Native Crash常常发生在带有Jni代码的APP中，或者系统的Native服务中。作为比较难分析的一类问题，Native Crash其实还是有较多的方法去定位。

Linux kdump配置详解

kdump.conf 配置文件里的coredump存储目录，确认目录位置和目录的空间（或目录所在的挂载点文件系统可用空间）

01

深入理解iOS Crash Log

USB连接设备，接着在XCode菜单栏依次选择：Window -> Devices And Simulators，接着选择View Device Logs

05

crash工具查询gs寄存器以及per-cpu基地址

#define irq_count() (preempt_count() & (HARDIRQ_MASK | SOFTIRQ_MASK \

03

故障分析 | binlog flush 失败导致的 Crash

某项目上出现 MySQL Crash，相关 errorlog 日志如下，从日志可以看出是 binlog error 导致的问题，但是无法确认具体原因，网上大部分资料都说是由于空间已满导致，后来在系统日志( /var/log/message)中确实找到了 / 分区空间已满的信息，所以基本可以确认 binlog error 是由于磁盘空间已满导致，进而造成 MySQL Crash。

02

Windows内核漏洞CVE-2016-0143分析

0x00 背景 4月20日，Nils Sommer在exploitdb上爆出了一枚新的Windows内核漏洞PoC。该漏洞影响所有版本的Windows操作系统，攻击者利用成功后可获得权限提升，微软在4月补丁日修复了该漏洞。 0x01 漏洞分析 NilsSommer并没有说明该漏洞为何种类型的漏洞，咋看崩溃场景会认为是NULL Pointerdereference或者UAF漏洞，粗略分析后，觉得是整数溢出漏洞，但是最后还是将其定义为特殊的NULL Pointerdereference漏洞。下面对漏洞成因进行

06

【内核模块auth_rpcgss】netns引用计数泄露导致容器弹性网卡残留

我们不久前定位了一个Linux内核bug，这个bug会影响所有在特权容器中启用了use-gss-proxy的Linux环境，表现为容器的网络命名空间(net namespace)无法彻底释放，导致容器终止后关联的虚拟网卡未能自动清除，运行时间长的机器上会观察到内存泄露。目前upstream还没有对这个bug的修复，我们内部已经做好了patch待测。这个问题的定位过程很有借鉴价值，特此与大家分享。【问题现象】在k8s环境里，容器终止之后概率性地发生弹性网卡残留现象，而且只有privileged容器

07

Linux服务器管理员操作

由于每台服务器都需要连接到 NAS，而且可能很多用户在不同的服务器上都有账号，这样的话就会导致 uid 冲突（不同服务器上不同用户的 uid 可能是一样的），因此，针对不同情况需要用到不同添加用户的方法：

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭