前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >JVM 垃圾收集器

JVM 垃圾收集器

作者头像
smartsi
发布2019-08-07 09:01:28
2780
发布2019-08-07 09:01:28
举报
文章被收录于专栏:SmartSiSmartSiSmartSi

本文“垃圾收集器”节选自《深入理解Java虚拟机:JVM高级特性与最佳实践》【作者:周志明】

如果说收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现。Java 虚拟机规范中对垃圾收集器应该如何实现并没有任何规定,因此不同的厂商、不同版本的虚拟机所提供的垃圾收集器都可能会有很大差别,并且一般都会提供参数供用户根据自己的应用特点和要求组合出各个年代所使用的收集器。下面讨论的是基于 JDK 1.7 Update 14 之后的 HotSpot 虚拟机。这个虚拟机包含的所有收集器如下图所示:

图中展示了7种作用于不同分代的收集器,如果两个收集器之间存在连线,就说明它们可以搭配使用。虚拟机所处的区域,则表示它是属于新生代收集器还是老年代收集器。下面会介绍这些收集器的特性,基本原理和使用场景。

1. Serial 收集器

Serial 收集器是最基本,发展历史最悠久的收集器,曾经(JDK 1.3.1 之前)是虚拟机新生代收集的唯一选择。这个收集器是一个单线程的收集器,只会使用一个CPU 或一条收集线程去完成垃圾收集工作。重要的是,它在进行垃圾收集时,必须暂停其他所有的工作线程,直到它收集结束。在用户不可见的情况下把用户正常工作的线程全部停掉,这对应用程序来说都是很难接受的。但是虚拟机的设计者表示完全理解,却又表示很无奈。举个例子来说:你妈妈给你打扫房间的时候,肯定也会让你老老实实的在椅子或房间外待着,如果她一边打扫卫生,你一边乱扔垃圾,这房间还嫩打扫完吗?

Serial 收集器看起来是一个鸡肋收集器,但是到现在为止,它依然是虚拟机运行在 Client 模式下的默认新生代收集器。这是因为它有着优于其他收集器的地方:简单而高效(与其他收集器的单线程相比),对于限定单个CPU的环境来说, 该收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集的效率。

Serial 收集器在新生代收集时采用复制算法。

2. ParNew 收集器

ParNew 收集器其实是 Serial 收集器的多线程版本,除了使用多线程进行垃圾收集之外,其余行为包括 Serial收集器可用的所有控制参数,收集算法,Stop The World,对象分配规则,回收策略等都与 Serial 收集器完全一样,在实现上,这两种收集器也共用了相当多的代码。

ParNew 收集器除了多线程收集之外,其他与 Serial收集器相比并没有太多的创新之处,但它却是许多运行在 Server 模型下的虚拟机首选的新生代收集器。其中一个与性能无关但是很重要的原因是,除了 Serial收集器之外,目前只有它能与 CMS 收集器配合工作。在 JDK 1.5 HotSpot推出了一款强交互应用中划时代的垃圾收集器 - CMS 收集器 (Concurrent Mark Sweep)。这款收集器是 HotSpot 虚拟机中第一款真正意义上的并发收集器,第一次实现了让垃圾收集线程与用户线程(基本上)同时工作。不幸的是 CMS 收集器作为老年代的收集器,却无法与 JDK 1.4.0中已经存在的 Parallel Scavenge收集器配合工作,所以在 JDK 1.5 中使用 CMS 来收集老年代的时候,新生代智能选择 ParNew 或者 Serial收集器。

ParNew 收集器在单 CPU 的环境中绝对不会有比 Serial 收集器更好的效果,甚至由于存在线程交互的开销,该收集器在通过超线程技术实现的两个 CPU 的环境中都不能百分百的保证可以超越 Serial 收集器。 随着可以使用的 CPU 的数量的增加,它对于 GC 时系统资源的有效利用还是很有好处的。

Serial 收集器一样,也是在新生代收集时采用复制算法。

3. Parallel Scavenge 收集器

Parallel Scavenge 收集器是一个新生代收集器,它也是使用复制算法的收集器,又是并行的多线程收集器,看上去跟 ParNew 收集器一样。

Parallel Scavenge 收集器的特点是它的关注点与其他的收集器不同, CMS 等收集器的关注点是尽可能的缩短垃圾收集时的用户线程的停顿时间, 而 Parallel Scavenge 收集器的目标则是达到一个可控制的吞吐量。停顿时间越短就越适合需要与用户交互的程序,良好的响应速度能提升用户体验,而高吞吐量则可以高效率的利用CPU时间,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。由于与吞吐量关系密切,该收集器也经常成为 吞吐量优先 收集器。Parallel Scavenge 收集器可以通过设置 -XX:+UseAdaptivSizePolicy 参数开启 GC 自适应调节策略,不需要手工指定新生代的大小(-Xmn),Eden与Survivor区的比例(-XX:SurvivorRatio),晋升老年代对象年龄等细节参数,虚拟机会根据当前系统的运行情况收集性能监控信息,动态调整这些参数以提供最合适的停顿时间或者最大的吞吐量。自适应调节策略也是Parallel Scavenge 收集器与 ParNew收集器的一个重要区别。

备注:

吞吐量 = 运行用户代码的时间 / (运行用户代码的时间 + 垃圾收集的时间)

Example:
虚拟机总共运行了100分钟,其中垃圾收集花掉1分钟,则吞吐量为99%

4. Serial Old 收集器

Serial Old 收集器是 Serial 收集器的老年代版本,它同样是一个单线程收集器,使用标记-整理算法。这个收集器的主要意义也是在于 Client 模式下的虚拟机使用。如果在 Server 模式下,那么它主要有两大用途: 一种用途是在 JDK1.5 以及之前的版本中与 Parallel Scavenge 收集器搭配使用, 另一种用途是作为 CMS 收集器的后备预案,在并发收集发生 Concurrent Mode Failure 时使用。

5. Parallel Old 收集器

Parallel Old 收集器是 Parallel Scavenge 收集器的老年代版本,使用多线程和 标记-整理算法。这个收集器是在 JDK 1.6 中才开始提供的。在此之前新生代 Parallel Scavenge 收集器一直处于比较尴尬的状态。原因是,如果新生代选择了 Parallel Scavenge 收集器,老年代除了 Serial Old收集器外别无选择。由于老年代 Serial Old 收集器在服务端应用性能上 拖累,使用了 Parallel Scavenge 收集器也未必能在整体应用上获得吞吐量最大化的效果。由于单线程的老年代收集中无法充分利用服务器多CPU的处理能力,在老年代很大而且硬件比较高级的环境中,这种组合的吞吐量甚至还不一定有ParNewCMS 的组合给力。

直到 Parallel Old 收集器出现后。吞吐量优先 收集器终于有了名副其实的应用组合,在注重吞吐量以及CPU资源敏感的场合,都可以优先考虑 Parallel ScavengeParallel Old 收集器。

6. CMS 收集器

CMS (Concurrent Mark Sweep) 收集器是一种以获得最短回收停顿时间为目标的收集器。CMS 收集器非常符合重视响应时间速度以及希望系统停顿时间最短的应用。从名字上就可以看出,CMS 收集器是基于 标记-清除 算法实现的,它的运作过程相对于前面几种收集器来说更复杂一些。整个过程可以分为4个步骤:

  • 初始标记
  • 并发标记
  • 重新标记
  • 并发清除

初始标记与重新标记这两个步骤仍然需要 Stop The World。 初始标记仅仅是标记一下 GC Roots 能直接关联到的对象,速度很快,并发标记是进行 GC Roots Tracing 的过程,而重新标记则是为了修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段稍长一些,但远比并发比较的时间短。

由于整个过程中耗时最长的并发标记和并发清除过程收集器线程都可以与用户线程一起工作,所以,从总体上来说,CMS 收集器的内存回收过程是与用户线程一起并发执行的。

CMS 是一款优秀的收集器,它的主要优点在名字上已经体现出来了:并发收集、低停顿。但是 CMS 收集器还远达不到完美的程度,它有以下三个明显的缺点:

(1) CMS 收集器对CPU资源非常敏感

其实,面向并发设计的程序都对CPU资源比较敏感。在并发阶段,它虽然不会导致用户线程停顿,但是会因为占用了一部分线程(或者说CPU资源)而导致应用程序变慢,总吞吐量会降低。CMS 默认启动的回收线程数是 (CPU数量+3)/ 4,也就是当CPU在4个以上时,并发回收时垃圾收集线程多于 25%的CPU资源,并且随着CPU数量的增加而下降。但是当CPU不足4个(譬如2个)时,CMS 对用户程序的影响就可能变得很大。

(2) CMS 收集器无法处理浮动垃圾

CMS 收集器无法处理浮动垃圾,可能出现 Concurrent Mode Failure 失败而导致另一次 Full GC 的产生。由于 CMS 并发清理阶段用户线程还在运行着,伴随程序运行自然就还会有新的垃圾不断产生,这一部分垃圾出现在标记过程之后,CMS 无法在当次收集中处理掉它们,只好留待下一次 GC 时再清理掉。这一部分垃圾就称为 浮动垃圾。也是由于在垃圾收集阶段用户线程还需要运行,那也就还需要预留有足够的内存空间给用户线程使用,因此 CMS 收集器不能像其他收集器那样等到老年代几乎完全被填满了再进行收集,需要预留一部分空间提供并发收集时的程序运作使用。在 JDK 1.5 默认设置下,CMS 收集器当老年代使用了 68% 的空间后就会被激活,这是一个偏保守的设置,如果在应用中老年代增长不是太快,可以适当调高触发百发比。在 JDK1.6 中, CMS收集器的启动阈值已经提升至 92%。运行期间预留的内存无法满足程序需要,就会出现一次 Concurrent Mode Failure 失败,这时虚拟机将启动后备预案:临时启用 Serial Old 收集器来重新进行老年代的垃圾收集,这样停顿时间就很长了。所以说,如果启动阈值设置的太高很容易导致大量这样的失败,性能反而会降低。

(3) CMS 收集器会产生大量空间碎片

CMS 是一款基于 标记—清除 算法实现的收集器,这意味着收集结束时会有大量空间碎片产生。空间碎片过多时,将会给大对象分配带来很大麻烦,往往会出现老年代还有很大空间剩余,但是无法找到足够大的连续空间来分配当前对象,不得不提前触发一次 Full GC

7. G1 收集器

G1Garbage-First)是一款面向服务端应用的垃圾收集器。HotSpot 开发团队赋予它的使命是未来可以替换掉 JDK 1.5 中发布的 CMS 收集器。与其他 GC 收集器相比,G1 具备如下特点:

(1) 并行与并发。G1 能充分利用多CPU、多核环境下的硬件优势,使用多个CPU来缩短 Stop-The-World 停顿的时间,部分其他收集器原本需要停顿 Java 线程执行的 GC 动作,G1 收集器仍然可以通过并发的方式让 Java 程序继续执行。

(2) 分代收集。与其他收集器一样,分代概念在 G1 中依然得以保留。虽然 G1 可以不需要其他收集器配合就能独立管理整个 GC 堆,但它能够采用不同的方式去处理新创建的对象和已经存活了一段时间、熬过多次 GC 的旧对象以获取更好的收集效果。

(3) 空间整合。与 CMS标记—清理 算法不同,G1 从整体来看是基于 标记—整理 算法实现的收集器,从局部(两个 Region 之间)上来看是基于 复制 算法实现的,但无论如何,这两种算法都意味着 G1 运作期间不会产生内存空间碎片,收集后能提供规整的可用内存。这种特性有利于程序长时间运行,分配大对象时不会因为无法找到连续内存空间而提前触发下一次 GC

(4) 可预测的停顿。这是 G1 相对于 CMS 的另一大优势,降低停顿时间是 G1CMS 共同的关注点,但 G1 除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为 M 毫秒的时间片段内,消耗在垃圾收集上的时间不得超过 N 毫秒。

G1 之前的其他收集器进行收集的范围都是整个新生代或者老年代,而 G1 不再是这样。使用 G1 收集器时,Java 堆的内存布局就与其他收集器有很大差别,它将整个 Java 堆划分为多个大小相等的独立区域(Region),虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,它们都是一部分 Region(不需要连续)的集合。

G1 收集器之所以能建立可预测的停顿时间模型,是因为它可以有计划地避免在整个 Java 堆中进行全区域的垃圾收集。G1 跟踪各个 Region 里面的垃圾堆积的价值大小(回收所获得的空间大小以及回收所需时间的经验值),在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的 Region(这也就是 Garbage-First 名称的来由)。这种使用 Region 划分内存空间以及有优先级的区域回收方式,保证了 G1 收集器在有限的时间内可以获取尽可能高的收集效率。

如果不计算维护 Remembered Set的操作, G1 收集器的运作大致可划分为以下几个步骤:

(1) 初始标记。初始标记阶段仅仅只是标记一下 GC Roots 能直接关联到的对象,并且修改 TAMS(Next Top at Mark Start)的值,让下一阶段用户程序并发运行时,能在正确可用的 Region 中创建新对象,这阶段需要停顿线程,但耗时很短。

(2) 并发标记。并发标记阶段是从 GC Root 开始对堆中对象进行可达性分析,找出存活的对象,这阶段耗时较长,但可与用户程序并发执行。

(3) 最终标记。最终标记阶段是为了修正在并发标记期间因用户程序继续运作而导致标记产生变动的那一部分标记记录,虚拟机将这段时间对象变化记录在线程 Remembered Set Logs 里面,最终标记阶段需要把 Remembered Set Logs 的数据合并到 Remembered Set 中,这阶段需要停顿线程,但是可并行执行。

(4) 筛选回收。筛选回收阶段首先对各个 Region 的回收价值和成本进行排序,根据用户所期望的 GC 停顿时间来制定回收计划,这个阶段其实也可以做到与用户程序一起并发执行,但是因为只回收一部分 Region,时间是用户可控制的,而且停顿用户线程将大幅提高收集效率。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018-02-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. Serial 收集器
  • 2. ParNew 收集器
  • 3. Parallel Scavenge 收集器
  • 4. Serial Old 收集器
  • 5. Parallel Old 收集器
  • 6. CMS 收集器
  • 7. G1 收集器
相关产品与服务
应用性能监控
应用性能监控(Application Performance Management,APM)是一款应用性能管理平台,基于实时多语言应用探针全量采集技术,为您提供分布式性能分析和故障自检能力。APM 协助您在复杂的业务系统里快速定位性能问题,降低 MTTR(平均故障恢复时间),实时了解并追踪应用性能,提升用户体验。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档