前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【Java虚拟机】JVM垃圾回收机制和常见回收算法原理

【Java虚拟机】JVM垃圾回收机制和常见回收算法原理

原创
作者头像
互联网小阿祥
发布2023-05-28 21:50:10
1.2K1
发布2023-05-28 21:50:10
举报
1.垃圾回收机制

(1)什么是垃圾回收机制(Garbage Collection, 简称GC)

  • 指自动管理动态分配的内存空间的机制,自动回收不再使用的内存,以避免内存泄漏和内存溢出的问题
  • 最早是在1960年代提出的,程序员需要手动管理内存的分配和释放
  • 这往往会导致内存泄漏和内存溢出等问题,同时也增加了程序员的工作量,特别是C++/C语言开发的时候
  • Java语言是最早实现垃圾回收机制的语言之一,其他编程语言,如C#、Python和Ruby等,也都提供了垃圾回收机制

(2)JVM自动垃圾回收机制

  • 指Java虚拟机在运行Java程序时,自动回收不再使用的对象所占用的内存空间的过程
  • Java程序中的对象,一旦不再被引用会被标记为垃圾对象,JVM会在适当的时候自动回收这些垃圾对象所占用的内存空间
  • 优点
  • 减少了程序员的工作量,不需要手动管理内存
  • 动态地管理内存,根据应用程序的需要进行分配和回收,提高了内存利用率
  • 避免内存泄漏和野指针等问题,增加程序的稳定性和可靠
  • 缺点
  • 垃圾回收会占用一定的系统资源,可能会影响程序的性能
  • 垃圾回收过程中会停止程序的执行,可能会导致程序出现卡顿等问题
  • 不一定能够完全解决内存泄漏等问题,需要在编写代码时注意内存管理和编码规范

(3)引用计数法

  • 基本思想,跟踪每个对象被引用的次数,当引用次数为0时,就可以将该对象回收
  • 在JVM中,每个对象都有一个引用计数器,当对象被引用时,引用计数器+1
  • 当对象被取消引用时,引用计数器-1
  • 当引用计数器为0时,该对象就可以被回收
  • 优点
    • 实现简单,回收垃圾的效率高
  • 缺点
    • 循环引用无法回收。如果两个对象互相引用,它们的引用计数器永远不会为0,因此无法被回收
    • 引用计数器开销大,每个对象都需要一个引用计数器,如果对象很多,开销就会很大
在这里插入图片描述
在这里插入图片描述
代码语言:java
复制
public class Main {
    public static void main(String[] args) {
        A a = new A();
        B b = new B();
        a.setB(b);
        b.setA(a);
        a = null;
        b = null;
        System.gc();
    }
}

class A {
    private B b;

    public void setB(B b) {
        this.b = b;
    }
}

class B {
    private A a;

    public void setA(A a) {
        this.a = a;
    }
}
  • 类A和类B相互引用,每个对象都持有对方的引用,形成了一个循环引用的环,当Main方法执行完毕后,a和b对象都置为null
  • 由于它们相互引用,它们的引用计数器都不为0,无法被垃圾回收器回收,导致内存泄漏
  • 但是上面代码却不会发生内存泄漏,因为多数jvm没有采用这个引用计数器方案,而是采用可达性分析算法

(4)可达性分析算法

  • 可达性分析算法的基本思想是通过一系列的“GC Roots”对象作为起点进行搜索。
  • 如果“GC Roots”和一个对象之间没有可达路径,则称该对象是不可达的,不过要注意的是被判定为不可达的对象不一定就会成为可回收对象。
  • 被判定为不可达的对象要成为回收对象,要至少经历两次标记过程。
  • 如果在这两次标记过程中仍然没有逃脱成为可回收对象的可能性,则基本上就真的成为可回收对象了。

通过一系列称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索走过的路径称为“引用链”,当一个对象到 GC Roots 没有任何的引用链相连时(从 GC Roots 到这个对象不可达)时,证明此对象不可用。

在这里插入图片描述
在这里插入图片描述

(5)什么是GC Root

  • 指一些被JVM认为是存活的对象,它们是垃圾回收算法的起点
  • 可以理解为由堆外指向堆内的引用, 本身是没有存储位置,都是字节码加载运行过程中加入 JVM 中的一些普通引用
  • 通俗的例子可以是一个树形结构,树的根节点就是GC Roots
  • 是垃圾回收器的起点,如果一个节点没有任何子节点与根节点相连,那这个节点就被认为是不可达的,可以被回收器回收

(6)JVM中的GCRoots对象有哪几种

  • 虚拟机栈(栈帧中的本地变量表)中引用的对象。
  • 方法区中类静态属性引用的对象
  • JDK 1.7 开始静态变量的存储从方法区移动到堆中
  • 比如你定义了一个static 的集合对象,那里面添加的对象就是可以被GC Root可达的
  • 方法区中常量引用的对象
  • 字符串常量池从 JDK 1.7 开始由方法区移动到堆中
  • 本地方法栈中JNI(即一般说的Native方法)引用的对象。

(7)对象可回收,就一定会被回收吗?

  • 不一定会回收,对象的finalize方法给了对象一次最后一次的机会。
  • 当对象不可达(可回收)并发生 GC 时,会先判断对象是否执行了 finalize 方法,如果未执行则会先执行 finalize 方法
  • 将当前对象与 GC Roots 关联,执行 finalize 方法之后,GC 会再次判断对象是否可达
  • 如果不可达,则会被回收,如果可达,则不回收!
  • 需要注意的是 finalize 方法只会被执行一次,如果第一次执行 finalize 方法,对象变成了可达,则不会回收
  • 但如果对象再次被 GC,则会忽略 finalize 方法,对象会被直接回收掉!
2.垃圾回收算法

(1)垃圾回收算法之标记-清除算法

  • 是一种常见的垃圾回收算法,它的基本思路是分为两个阶段:标记阶段和清除阶段
  • 标记阶段
    • 垃圾回收器会从一些GC Roots对象开始,遍历整个对象图,标记所有被引用的对象
    • 被标记的对象会被打上标记,表示这些对象是“活”的对象,需要保留下来,未被标记的对象就是垃圾对象,可以被回收
  • 清除阶段
    • 垃圾回收器会对所有未被标记的对象进行回收
在这里插入图片描述
在这里插入图片描述
  • 优点
    • 能够回收不连续的内存空间
  • 缺点
    • 标记和清除两个步骤,都需要垃圾回收器遍历整个对象图,耗费时间较长
    • 会产生内存碎片,当频繁进行垃圾回收时,内存碎片会越来越多导致可用内存空间不足,从而影响程序的性能和稳定性
  • 应用场景
    • 在实际应用中,标记清除法一般用于不需要频繁进行垃圾回收的场景,比如在Java堆中大对象的分配和回收
    • 后续的收集算法大多都是以标记-清除算法为基础,对其缺点进行改进

(2)垃圾回收算法之标记-复制算法

  • 标记算法是一种常见的垃圾回收算法,它的基本思路是将Java堆分为两个区域:一个活动区域和一个空闲区域
  • 在垃圾回收过程中,首先标记所有被引用的对象
  • 然后将所有被标记的对象复制到空闲区域中,最后交换两个区域的角色,完成垃圾回收
  • 标记复制算法的详细实现步骤
    • 将Java堆分为两个区域:一个活动区域和一个空闲区域,初始时,所有对象都分配在活动区域中
    • 从GC Roots对象开始,遍历整个对象图,标记所有被引用的对象
    • 对所有被标记存活的对象进行遍历,将它们复制到空闲区域中,并更新所有指向它们的引用,使它们指向新的地址
    • 对所有未被标记的对象进行回收,将它们所占用的内存空间释放
    • 交换活动区域和空闲区域的角色,空闲区域变为新的活动区域,原来的活动区域变为空闲区域
    • 当空闲区域的内存空间不足时,进行一次垃圾回收,重复以上步骤。
在这里插入图片描述
在这里插入图片描述
  • 优点
    • 如果内存中的垃圾对象较多,需要复制的对象就较少,则效率高
    • 清理后,内存碎片少
  • 缺点
    • 标记复制算法的效率较高,但是预留一半的内存区域用来存放存活的对象,占用额外的内存空间
    • 如果出现存活对象数量比较多的时候,需要复制较多的对象 效率低
    • 假如是在老年代区域,99%的对象都是存活的,则性能底,所以老年代不适合这个算法
  • 应用场景
  • 标记复制算法一般用于新生代的垃圾回收,因此需要对新生代的对象进行分代管理
  • 虚拟机多数采用这个算法,对新生代进行内存管理,因为多数这个新生代区域的存活对象数量少
  • 国外有公司统计过多数业务,98%撑不过一次GC; 所以不用1:1比例分配新生代的空间
  • 原因
    • GC时, 将Eden和Survivor中存活对象一次性复制到另外一块Survivor空间上, 然后清理掉Eden和已用过的那块Survivor空间
    • 每次新生代中可用内存空间为整个新生代容量的90% (Eden的80% + Survivor的 10%) ,
    • 只有一个Survivor空间, 即10%的新生代是会被浪费而已
在这里插入图片描述
在这里插入图片描述

(3)垃圾回收算法之标记-整理算法

  • 从根节点开始对所有可达对象做一次标记,但之后并不简单地清理未标记的对象,而是将所有的存活对象压缩到内存的一端
  • 然后清理边界外的垃圾,避免了碎片的产生,也不需要两块相同的内存空间,因此性价比比较高
在这里插入图片描述
在这里插入图片描述
  • 优点
    • 解决了标记清除算法的碎片化的问题
    • 对比标记-复制算法,不用浪费额外的空间
    • 对比 标记-清除算法与标记-整理算法,前者是一种非移动式的回收算法, 而后者是移动式的回收,且没有了碎片化内存
  • 缺点
    • 效率相比于标记复制算法低一些
    • 在整理存活对象时,因对象位置的变动,需要该调整虚拟机栈中的引用地址
  • 应用场景
    • 标记-压缩算法是一种老年代的回收算法,它在标记-清除算法的基础上做了一些优化。

(4)垃圾回收算法之分代收集算法

  • 针对不同生命周期的对象采用不同的垃圾回收策略,以达到更好的垃圾回收效果
  • 年轻代多数对象存活时间短,高频进行回收;老年代多数对象存活时间久,进行低频回收
  • 分代算法是根据回收对象的特点进行选择,年轻代适合标记-复制算法,老年代适合标记清除或标记压缩算法
  • 通过将内存划分为不同的代,可以使得Minor GC的频率更高,更早地回收垃圾对象,减少Full GC的发生频率,提高整体性能
在这里插入图片描述
在这里插入图片描述
  • JVM将内存分为年轻代和老年代,其中年轻代又分为Eden区和两个Survivor区
  • 年轻代
    • 用于存放新生的对象,其中Eden区是新对象的分配区域
    • 当Eden区满时,会触发Minor GC,将存活的对象移动到Survivor区,同时清空Eden区
    • Survivor区则用于存放经过一次Minor GC后存活的对象
  • 老年代
    • 用于存放长时间存活的对象,当年轻代中的对象经过多次Minor GC后仍然存活,就会被移动到老年代
    • 当老年代满时,会触发Full GC
  • GC的分类和专业术语
    • 部分收集(Partial GC)
      • 新生代收集
        • 对象从Young 区域消失的过程称为”minor GC / Young GC
        • Eden 的清理,S0\S1的清理都由于MinorGC
        • YoungGen区内存不足,会触发minorGC
      • 老年代收集
        • 对象从老年代中消失的过程,清理整合OldGen的内存空间,称为”Major GC/Old GC“
        • 有些垃圾收集器 针对老年代单独回收,所以比较少用
    • 整堆收集(Full GC)
      • 是清理整个堆空间,包括年轻代和老年代
      • 理解为Major GC+Minor GC组合后进行的一整个过程,是清理JVM整个堆空间
    • FullGC触发场景
      • 手工调用System.gc( ), 建议执行Full GC,不一定会执行,可通过-XX:+ DisableExplicitGC 参数来禁止调用System.gc()
      • 老年代空间不足 , 通过Minor GC后进入老年代的平均大小大于老年代的可用内存
    • STW(Stop The World)
      • 垃圾回收发生过程中,用户线程在运行至安全点(safe point)后,就自行挂起进入暂停状态,对外的表现就是卡顿
      • 所以应尽量减少Full GC的次数,是Minor GC还是Major GC都会STW,区别只在于STW的时间长短

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.垃圾回收机制
  • 2.垃圾回收算法
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档