首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >小师妹学JVM之:GC的垃圾回收算法

小师妹学JVM之:GC的垃圾回收算法

作者头像
程序那些事
发布2020-07-07 15:59:29
3030
发布2020-07-07 15:59:29
举报
文章被收录于专栏:程序那些事程序那些事

简介

JVM的重要性不言而喻了,如果把java的应用程序比作一辆跑车,那么JVM就是这辆车的发动机,没有它,java程序就成了空中楼阁,无根浮萍。而在JVM中有一块内存区域叫做运行时数据区域,存储了运行时所需要的所有对象,而Heap Area则是其中最大的一块。

内存毕竟不是无限的,所以就需要一种机制来将不再使用的对象进行回收,这种机制就是今天我们要讲的GC。

对象的生命周期

小师妹:F师兄,你相信这个世界有轮回吗?

师兄我是一个坚定的无神论者,活在当下就好了,何必操心后面的轮回呢?

小师妹:F师兄,这个你就不懂了,意识是组成脑的原子群的一种组合模式,我们大脑的物质基础和一块石头没有什么不同。当我们掌握大脑的组合方式,然后重构,我们的意识就重现了,这就是轮回。这可是量子理论中提到的观念哦。

哇,小师妹什么时候这么厉害了,都开始探讨这么高深的话题了。F师兄我实在是跟不上节奏啊。

小师妹,F师兄,我是怕你尴尬,想引出java对象的生命周期这个话题嘛。

量子理论我不熟,java对象我还没怕过谁。

对象的生命周期其实很简单:创建,使用中,最后被销毁。

01

创建对象

举个最简单的创建对象的例子:

Object obj = new Object();

对象创建的时候,将会为该对象分配特定的空间。

02

使用对象

对象创建之后,就可以被其他的对象使用,如果其他的对象有使用该对象,那么我们成为该对象被引用了。

03

对象销毁

当一个对象没有被其他对象引用的时候,我们就称为该对象可以被回收了。在Java中,对象的回收是由GC来负责的。

垃圾回收算法

小师妹:F师兄,我觉得垃圾回收好像挺简单的,我们为每个对象维持一个指针计数器,每引用一次就加一,这样不就可以实现垃圾回收器了吗?

底层原理是这么一个道理,但是JVM需要一种更加高效的算法来保证垃圾回收的效率,同时也不会影响正在运行的程序。

接下来我们将会介绍一下,在JVM中比较常用几个垃圾回收算法:

Mark and sweep

Mark and sweep是最最简单的垃圾回收算法,简单点讲,它可以分为两个步骤:

01

标记live对象

标记live对象听起来很简单,就是扫描堆中的对象,看这些对象是否被引入。

但是这里有一个问题,如果是两个对象互相引用的时候,而这两个对象实际上并没有被外部的对象所引用,那么这两个对象其实是应该被回收的。所以我们还需要解决一个关键性的问题:从哪里开始扫描的问题。

JVM定义了一些Root对象,从这些对象开始,找出他们引用的对象,组成一个对象图。所有在这个图里面的对象都是有效的对象,反之不在对象图中的对象就应该被回收。有效的对象将会被Mark为alive。

这些Root对象包括:正在执行的方法中的本地对象和输入参数。活动的线程,加载类中的static字段和JNI引用。

注意,这种遍历其实是有个缺点的,因为为了找到对象图中哪些对象是live的,必须暂停整个应用程序,让对象变成静止状态,这样才能构建有效的对象图。后面我们会介绍更加有效的垃圾回收算法。

02

删除对象

扫描对象之后,我们就可以将未标记的对象删除了。

删除有三种方式,第一种方式是正常删除。但是正常删除会导致内存碎片的产生。所以第二种方式就是删除之后进行压缩,以减少内存碎片。还有一种方式叫做删除拷贝,也就是说将alive的对象拷贝到新的内存区域,这样同样可以解决内存碎片的问题。

Concurrent mark sweep (CMS)

在讲CMS之前,我们先讲一下垃圾回收器中的Eden,Old和Survivor space几个大家应该都很熟悉的分代技术。

Young Gen被划分为1个Eden Space和2个Suvivor Space。当对象刚刚被创建的时候,是放在Eden space。垃圾回收的时候,会扫描Eden Space和一个Suvivor Space。如果在垃圾回收的时候发现Eden Space中的对象仍然有效,则会将其复制到另外一个Suvivor Space。

就这样不断的扫描,最后经过多次扫描发现任然有效的对象会被放入Old Gen表示其生命周期比较长,可以减少垃圾回收时间。

之后要讲的几个垃圾回收器,除了ZGC,其他都使用的是分代的技术。

好了,现在继续讲CMS,CMS是mark and swap的升级版本,它使用多个线程来对heap区域进行扫描,从而提升效率。

CMS在Young Generation中使用的是mark-copy,而在Old Generation主要使用的是mark-sweep。

使用CMS的命令很简单:

-XX:+UseConcMarkSweepGC

上面是列出的一些CMS的调优参数。

Serial garbage collection

Serial garbage collection使用单一的线程来进行垃圾回收操作,其好处就是不需要和其他的线程进行交互。如果你是单核的CPU,那么最好就是选择Serial garbage collection,因为你不能充分利用多核的好处。同样的它也常常用在比较小型的项目中。

Serial garbage collection在Young Generation中使用的是mark-copy,而在Old Generation主要使用的是 mark-sweep-compact。

下面是开启命令:

-XX:+UseSerialGC

Parallel garbage collection

和serial GC类似,它在Young Generation中使用的是mark-copy,而在Old Generation主要使用的是 mark-sweep-compact。不同的是它是并行的。

可以通过下面的命令来指定并发的线程:

-XX:ParallelGCThreads=N

如果你是多核处理器,那么Parallel GC可能是你的选择。

Parallel GC是JDK8中的默认GC。而在JDK9之后, G1是默认的GC。

使用下面的命令来开启Parallel GC:

-XX:+UseParallelGC

G1 garbage collection

为什么叫G1呢,G1=Garbage First,它是为替换CMS而生的,最早出现在java7中。

G1将heap区域划分成为多个更小的区域,每个小区域都被标记成为young generation 或者old generation。从而运行GC在更小的范围里运行,而不是影响整个heap区域。

可以使用下面的命令来开启:

-XX:+UseG1GC

Z Garbage Collection

ZGC是一个可扩展的,低延迟的GC。ZGC是并发的,而且不需要停止正在运行的线程。

使用下面的命令来开启:

-XX:+UseZGC 

ZGC是在JDK11中被引入的。

怎么选择

小师妹:F师兄,你讲了这么多个GC,到底我该用哪个呢?

高射炮不能用来打蚊子,所以选择合适的GC才是最终要的。这里F师兄给你几个建议:

如果你的应用程序内存本来就很小,那么使用serial collector :

 -XX:+UseSerialGC

如果你的程序运行在单核的CPU上,并且也没有程序暂停时间的限制,那么还是使用serial collector :

-XX:+UseSerialGC

如果对峰值期的性能要求比较高,但是对程序暂停时间没多大的要求,那么可以使用 parallel collector:

 -XX:+UseParallelGC

如果更加关注响应时间,并且GC的对程序的暂停时间必须要小,那么可以使用

-XX:+UseG1GC

如果响应时间非常重要,并且你在使用大容量的heap空间,那么可以考虑使用ZGC:

 -XX:UseZGC

总结

本文介绍了几种GC的算法,大家可以根据需要选用。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-06-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序那些事 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档