专栏首页IT技术小咖JVM故障分析及性能优化实战(VII)——使用MAT的Histogram和Dominator Tree定位溢出源

JVM故障分析及性能优化实战(VII)——使用MAT的Histogram和Dominator Tree定位溢出源

上一篇文章概括的介绍了JVM Heap Dump文件生成的方式以及内存分析工具MAT的概要功能,今天讲解如何使用MAT的Histogram和Dominator Tree两个视图,定位到内存溢出源。

JVM故障分析及性能优化实战:

JVM故障分析及性能优化实战(I)——使用jstack定位线程堆栈信息

JVM故障分析及性能优化实战(II)——jstack生成的Thread Dump日志结构解析

JVM故障分析及性能优化实战(III)——jstat命令的使用及VM Thread分析

JVM故障分析及性能优化实战(IV)——jstack生成的Thread Dump日志线程状

JVM故障分析及性能优化实战(V)——常见的Thread Dump日志案例分析

JVM故障分析及性能优化实战(VI)——JVM Heap Dump(堆转储文件)的生成和MAT的使用

目录

  • 1
    • 1.1 Shallow Heap 和 Retained Heap
    • 1.2 对象引用(Reference)
    • 1.3 GC Roots和Reference Chain
  • 2 Histogram(直方图)视图
  • 3 Dominator Tree视图
  • 4 定位溢出源
  • 5 后续观察

基础概念

先列出几个基础的概念:

Shallow Heap 和 Retained Heap

Shallow Heap表示对象本身占用内存的大小,不包含对其他对象的引用,也就是对象头加成员变量(不是成员变量的值)的总和。

Retained Heap是该对象自己的Shallow Heap,并加上从该对象能直接或间接访问到对象的Shallow Heap之和。换句话说,Retained Heap是该对象GC之后所能回收到内存的总和。

把内存中的对象看成下图中的节点,并且对象和对象之间互相引用。这里有一个特殊的节点GC Roots,这就是reference chain的起点。

从obj1入手,上图中蓝色节点代表仅仅只有通过obj1才能直接或间接访问的对象。因为可以通过GC Roots访问,所以左图的obj3不是蓝色节点;而在右图却是蓝色,因为它已经被包含在retained集合内。所以对于左图,obj1的retained size是obj1、obj2、obj4的shallow size总和;右图的retained size是obj1、obj2、obj3、obj4的shallow size总和。obj2的retained size可以通过相同的方式计算。

对象引用(Reference)

对象引用按从最强到最弱有如下级别,不同的引用(可到达性)级别反映了对象的生命周期:

  • 强引用(Strong Ref):通常我们编写的代码都是强引用,于此相对应的是强可达性,只有去掉强可达性,对象才能被回收。
  • 软引用(Soft Ref):对应软可达性,只要有足够的内存就一直保持对象,直到发现内存不足且没有强引用的时候才回收对象。
  • 弱引用(Weak Ref):比软引用更弱,当发现不存在强引用的时候会立即回收此类型的对象,而不需要等到内存不足。通过java.lang.ref.WeakReference和java.util.WeakHashMap类实现。
  • 虚引用(Phantom Ref):根本不会在内存中保持该类型的对象,只能使用虚引用本身,一般用于在进入finalize()方法后进行特殊的清理过程,通过java.lang.ref.PhantomReference实现。

GC Roots和Reference Chain

JVM在进行GC的时候是通过使用可达性来判断对象是否存活,通过GC Roots(GC根节点)的对象作为起始点,从这些节点开始进行向下搜索,搜索所走过的路径成为Reference Chain(引用链),当一个对象到GC Roots没有任何引用链相连(用图论的话来说就是从GC Roots到这个对象不可达)时,则证明此对象是不可用的。

如下图所示,对象object 5、object 6、object 7虽然互相有关联,它们的引用并不为0,但是它们到GC Roots是不可达的,因此它们将会被判定为是可回收的对象。

Histogram(直方图)视图

点击工具栏上的

图标可以打开Histogram(直方图)视图,可以列出每个类产生的实例数量,以及所占用的内存大小和百分比。主界面如下图所示:

图中Shallow Heap 和 Retained Heap分别表示对象自身不包含引用的大小和对象自身并包含引用的大小,具体请参考下面 Shallow Heap 和 Retained Heap 部分的内容。默认的大小单位是 Bytes,可以在 Window - Preferences 菜单中设置单位,图中设置的是KB。

通过直方图视图可以很容易找到占用内存最多的几个类(通过Retained Heap排序),还可以通过其他方式进行分组(见下图)。

如果存在内存溢出,时间久了溢出类的实例数量或者内存占比会越来越多,排名也越来越靠前。可以点击工具类上的

图标进行对比,通过多次对比不同时间点下的直方图对比就很容易把溢出的类找出来。

还有一种对比直方图的方式,首先通过 Window 菜单打开 Navigation History 视图,选中直方图右键并选中 Add to Compare Basket项目,将直方图添加到 Compare Basket 中。

然后在 Compare Basket 中点击右上角的

按钮,可以分别列出对比的所有结果,见下图:

并且在上面的可以设置不同的对比方式。

Dominator Tree视图

点击工具栏上的

图标可以打开Dominator Tree(支配树)视图,在此视图中列出了每个对象(Object Instance)与其引用关系的树状结构,同时包含了占用内存的大小和百分比。

通过Dominator Tree视图可以很容易的找出占用内存最多的几个对象(根据Retained Heap或Percentage排序),和Histogram类似,可以通过不同的方式进行分组显示:

定位溢出源

Histogram视图和Dominator Tree视图的角度不同,前者是基于类的角度,后者是基于对象实例的角度,并且可以更方便的看出其引用关系。

首先,在两个视图中找出疑似溢出的对象或者类(可以通过Retained Heap排序,并且可以在Class Name中输入正则表达式的关键词只显示指定的类名),然后右键选择Path To GC Roots(Histogram中没有此项)或Merge Shortest Paths to GC Roots,然后选择 exclude all phantom/weak/soft etc. reference

GC Roots意为GC根节点,其含义见上面的 GC Roots和Reference Chain 部分,后面的 exclude all phantom/weak/soft etc. reference 意思是排除虚引用、弱引用和软引用,即只剩下强引用,因为除了强引用之外,其他的引用都可以被JVM GC掉,如果一个对象始终无法被GC,就说明有强引用存在,从而导致在GC的过程中一直得不到回收,最终就内存溢出了。

通过结果就可以很方便的定位到具体的代码,然后分析是什么原因无法释放该对象,比如被缓存了或者没有使用单例模式等等。

下面是执行的结果:

上图中保留了大量的VelocitySqlBulder的外部引用,后来查看了代码,原来每次调用的时候都实例化一个新的对象,由于VelocitySqlBulder类是无状态的工具类,因此修改为单例方式就可以解决这个问题。

后续观察

根据上面分析的结果对问题进行处理之后,再对照之前的操作,看看对象是否还再持续增长,如果没有就说明这个地方的问题已经解决了。

最后再用 jstat 持续跟踪一段时间,看看Old和Perm区的内存是否最终稳定在一个范围之内,如果长时间稳定在一个范围说明溢出问题得到了解决,否则还要继续进行分析和处理,一直到稳定为止。

本文分享自微信公众号 - IT技术小咖(IT-arch),作者:Jet Ma

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-09-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 了解什么是 redis 的雪崩和穿透?

    对于系统 A,假设每天高峰期每秒 5000 个请求,本来缓存在高峰期可以扛住每秒 4000 个请求,但是缓存机器意外发生了全盘宕机。缓存挂了,此时 1 秒 50...

    IT技术小咖
  • 如何保证 redis 的高并发和高可用?(redis 主从架构)

    如果你用 redis 缓存技术的话,肯定要考虑如何用 redis 来加多台机器,保证 redis 是高并发的,还有就是如何让 redis 保证自己不是挂掉以后就...

    IT技术小咖
  • Kafka 工作机制

    Kafka 是 Apache 的子项目,是一个高性能跨语言的分布式发布/订阅消息队列系统(没有严格实现 JMS 规范的点对点模型,但可以实现其效果),在企业开发...

    IT技术小咖
  • Google Keybox功能与TEE关系介绍

    昨天介绍了Keystore功能,今天来普及一下Keybox。这个也与可信执行环境TEE有着密切的关系! Keybox就是Android的密钥箱功能,用于解密受D...

    安智客
  • JVM从头学(一)—— 堆栈与JVM内存模型

    堆的数据结构是一个完全二叉树,一般使用于优先队列。堆分大数堆和小数堆,大数堆是大数在父节点,小数,小数堆是小数在子节点。每次排序后的次数也有限,插入排序的次数是...

    逝兮诚
  • Linux 磁盘管理常用命令硬盘分区和格式化概述在VM虚拟机添加硬盘MBR分区

    JavaEdge
  • Restful Objects for .NET

    Restful Objects是关于领域对象模型的超媒体API的公共规范。该规范的1.0.0 版本刚刚发布并提供下载,并且目前已经出现了两个实现了该规范的开源框...

    张善友
  • 如何在Ubuntu 14.04上使用Bower管理前端JavaScript和CSS依赖项

    Bower是前端模块的包管理器,通常由JavaScript和/或CSS组成。它使我们可以轻松搜索,安装,更新或删除这些前端依赖项。

    SQL GM
  • AI 影响因子 9 月结果出炉,商汤科技成为最大赢家

    「AI 影响因子」是雷锋网学术频道 AI 科技评论旗下数据库项目,旨在呈现国内企业研究院学术&开发实力,为高校学生及从业者提供在会议/期刊论文、数据集比赛及开发...

    AI科技评论
  • 通过Xtrabackup日志来恢复检查点文件

    最近积压了很多朋友的问题,我想起来的时候就回复一下,别见怪,不是我有势利眼。 前几天有个朋友问我的问题,是在xtrabackup的时候,没有特别保留checkp...

    jeanron100

扫码关注云+社区

领取腾讯云代金券