Java垃圾回收机制详解

#概述 由于JVM中垃圾收集器的存在,使得Java程序员在开发过程中可以不用关心对象创建时的内存分配以及释放过程,当内存不足时,JVM会自动开启垃圾收集线程,进行垃圾对象的回收。 那么垃圾回收线程到底是什么时候触发,并如何实现垃圾回收的呢?本文将对openjdk的源码进行分析,并通过代码分析Java垃圾回收的过程。

VMThread

VMThread主要负责调度执行虚拟机内部的VM线程操作,如GC操作等,在JVM实例创建时进行初始化。

VMThread::create()

VMThread::create()方法负责该线程的创建。

在create方法里主要执行两个事情:

  1. VMThread内部维护了一个VMOperationQueue类型的队列,用于保存内部提交的VM线程操作VM_operation,在VMThread创建时会对该队列进行初始化。
  2. 由于VMThread本身就是一个线程,启动后通过执行loop方法进行轮询操作,从队列中按照优先级取出当前需要执行的VM_operation对象并执行。

其中整个现成的轮询过程分为两步: 第一步

如果队列为空,_vm_queue->remove_next()方法则返回空的_cur_vm_operation,否则根据队列中的VM_operation优先级进行重新排序,并返回队列头部的VM_operation。如果_cur_vm_operation为空,则执行如下逻辑:

通过执行VMOperationQueue_lock->wait方法等待VM operation。

第二步

如果当前vm_operation需要在安全点执行,如FULL GC,则执行上述逻辑,否则执行以下逻辑:

通过evaluate_operation执行当前的_cur_vm_operation,最终调用vm_operation对象的evaluate方法。

子类通过重写VM_Operation类的doit方法实现具体的逻辑。

Java gc触发

在Java的内存分配机制中,当新生代不足以分配对象所需的内存时,会触发一次YGC,具体实现如下:

上面这段代码的意思是创建一个VM_GenCollectForAllocation类型的VM_Operation,通过执行VMThread::execute方法保存到VMThread的队列中,其中execute的核心实现如下:

YGC的VM_Operation加入到队列后,通过执行VMOperationQueue_lock的notify方法唤醒VMThread线程,等待被执行,其中VM_GenCollectForAllocation的doit方法实现:

通过VMThread调度执行gc操作,最终调用对应的doit方法: 1、利用SvcGCMarker通知minor gc操作的开始; 2、设置触发gc的原因为GCCause::_allocation_failure,即内存分配失败; 3、其中GenCollectedHeap的satisfy_failed_allocation方法会调用GC策略的satisfy_failed_allocation方法,处理内存分配失败的情况;

satisfy_failed_allocation

如果其它线程触发了gc操作,则通过扩展内存代的容量进行分配,最后不管有没有分配成功都返回,等待其它线程的gc操作结束;

如果增量式gcincremental collection可行,则通过do_collection方法执行一次minor gc,即回收新生代的垃圾。

如果增量式gc不可行,则通过do_collection方法执行一次full gc。

gc结束之后,再次从内存堆的各个内存代中依次分配指定大小的内存块,如果分配成功则返回,否则继续。

如果gc结束后还是分配失败,说明gc失败了,则再次尝试通过允许扩展内存代容量的方式来试图分配指定大小的内存块。

如果执行到这一步,说明gc之后还是内存不足,则通过do_collection方法最后再进行一次彻底的gc,回收所有的内存代,对堆内存进行压缩,且清除软引用。

经过一次彻底的gc之后,最后一次尝试依次从各内存代分配指定大小的内存块。

:从上述分析中可以发现,gc操作的入口都位于GenCollectedHeap::do_collection方法中,不同的参数执行不同类型的gc。

do_collection实现

执行gc操作必须满足四个条件: 1、在一个同步安全点,VMThread在调用gc操作时会通过SafepointSynchronize::begin/end方法实现进出安全区域,调用begin方法时会强制所有线程到达一个安全点; 2、当前线程是VM线程或并发的gc线程; 3、当前线程已经获得内存堆的全局锁; 4、内存堆当前_is_gc_active参数为false,即还未开始gc;

如果当前有其它线程触发了gc,则终止当前的gc线程,否则继续。

根据参数do_clear_all_soft_refs和GC策略判断本次gc是否需要清除软引用;记录当前永久代的使用量perm_prev_used;如果启动参数中设置了-XX:+PrintHeapAtGC,则打印GC发生时内存堆的信息。

1、设置参数_is_gc_active为真,表示当前线程正式开始gc操作; 2、判断当前是否要进行一次full gc,并确定触发full gc的原因,如通过调用System.gc()触发; 3、如果设置了PrintGC和PrintGCDateStamps,则在输出日志中添加时间戳; 4、如果设置了PrintGCDetails,则打印本次gc的详细CPU耗时,如 user_time、system_time和real_time; 5、gc_prologue方法在gc开始前做一些前置处理,如设置每个内存代的_soft_end字段; 6、更新发生gc的次数_total_collections,如果当前gc是full gc,则还需更新发生full gc的次数_total_full_collections;

获取当前内存堆的使用量gch_prev_used;初始化开始回收的内存代序号starting_level,默认为0,即从最年轻的内存代开始;如果当前gc是full gc,则从最老的内存代开始向前搜索,找到第一个可收集所有新生代的内存代,稍后从该内存代开始回收;

从序号为starting_level的内存代开始回收;如果当前内存代不需要进行回收,则处理下一个内存代,否则对当前内存进行回收;如果当前内存代所有内存代中最老的,则将本次的gc过程升级为full gc,更新full gc的次数,并执行full gc的前置处理。

1、如果设置了参数HeapDumpBeforeFullGC,则对内存堆进行dump; 2、如果设置了参数PrintClassHistogramBeforeFullGC,则打印在进行FGC之前的对象;

1、统计各个内存代进行gc时的数据; 2、如果开启了ZapUnusedHeapArea,则在回收每个内存代时都要对内存代的内存上限地址top进行更新;

到这一步才开始真正的gc操作:设置当前内存代的_saved_mark值,即设置这些内存区域块的上限地址;通过每个内存代管理器的collect方法对垃圾对象的进行回收,垃圾收集算法的具体细节会在后文进行分析;

1、如果当前是FGC,则调用post_full_gc_dump方法通知gc已经完成,可以进行后续操作,如果设置了参数HeapDumpAfterFullGC,则在gc后可以对堆内存进行dump;如果设置了参数PrintClassHistogramAfterFullGC,则在gc后可以打印存活的对象; 2、如果设置了参数PrintGCDetails,则在gc后可以打印内存堆的变化情况;如果当前还是FGC,则还可以打印永久代的内存变化情况。

gc完成后,调整内存堆中各内存代的大小;如果是FGC,则还需要调整永久代大小;获取FullGCCount_lock锁,对_full_collections_completed进行更新,并通过锁机制通知本次FGC已经完成;

打印内存堆的gc总次数和FGC次数;ExitAfterGCNum默认是0,如果设置ExitAfterGCNum大于0,且gc的总次数超过ExitAfterGCNum,则终止整个JVM进程。到此Java jvm垃圾回收进程就终止gc进程。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏青玉伏案

Git知识总览(六) Git分支中的远程操作实践

前几篇博客陆陆续续的讲了好多关于Git操作的内容, 其中在上篇博客聊了《Git中的merge、rebase、cherry-pick以及交互式rebase》,本篇...

357110
来自专栏逸鹏说道

JQ动态生成的元素,原事件绑定失效

13320
来自专栏DOTNET

【翻译】MongoDB指南/CRUD操作(三)

【原文地址】https://docs.mongodb.com/manual/ CRUD操作(三) 主要内容: 原子性和事务(Atomicity and Tran...

30690
来自专栏FreeBuf

Cookiel劫持测试工具 – Cookie Injecting Tools

Cookie Injecting Tools 是一款简单的开源cookie利用工具,是Chrome浏览器上开发的一个扩展插件,能够灵活地进行SQL注入测试,编辑...

28170
来自专栏程序员宝库

NGINX 宏观手记

任何一个工具都有它的灵魂所在,作为一个PHP程序员,我们可能仅仅使用了它的一小部分,这篇文章让你更加了解Nginx,本章大多都是总结、翻译、整理 ,希望你可以知...

6410
来自专栏Aloys的开发之路

javadoc相关问题

src源代码生成html格式文档:http://www.cnblogs.com/shenliang123/archive/2012/04/23/2466483....

254100
来自专栏纯洁的微笑

jvm堆内存溢出后,其他线程是否可继续工作

最近网上出现一个美团面试题:“一个线程OOM后,其他线程还能运行吗?”。我看网上出现了很多不靠谱的答案。这道题其实很有难度,涉及的知识点有jvm内存分配、作用域...

15010
来自专栏Grace development

NGINX宏观手记

任何一个工具都有它的灵魂所在,作为一个PHP程序员,我们可能仅仅使用了它的一小部分,这篇文章让你更加了解Nginx,本章大多都是总结、翻译、整理 ,希望你可以知...

8420
来自专栏公众号_薛勤的博客

JVM虚拟机性能监控与调优(JDK命令行、JConsole)

很多资料在介绍JDK命令行工具时并不是在Java8环境下,因此还在使用过时的永久区系列的参数,给一些读者造成困难。

54520
来自专栏腾讯云TStack专栏

对象存储,了解一下

? 对象存储,通常指 S3 (Simple Storage Service) 服务,由AWS提供公有云服务,而 Ceph 也可以提供兼容 S3 协议的对象存储...

93020

扫码关注云+社区

领取腾讯云代金券