首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

十个问题弄清JVM&GC(一)

每个java开发同学不管是日常工作中还是面试里,都会遇到JDK、JVM和GC的问题。本文会从以下10个问题为切入点,带着大家一起全面了解一下JVM的方方面面。

  • JVM、JRE和JDK的区别和联系
  • JVM是什么?以及它的主要作用
  • JVM的核心功能有哪些
  • 类加载机制和过程
  • 运行时数据区的逻辑结构
  • JVM的内存模型
  • 如何确定对象是垃圾
  • 垃圾收集的算法有哪些
  • 各种问世的垃圾收集器
  • JVM调优的参数配置

1、JVM、JRE和JDK的区别和联系

这个基本是步入java世界的入门级知识认知,首先我们来看一下来自java官网的一张图:

从这张图里我们基本就可以看出“JRE”是运行Java语言编写的程序所不可缺少的运行环境。有了JRE我们写的java程序才可以运行起来被用户所使用。

而“JDK”俗称java开发工具包,它包括了Java运行环境JRE(Java Runtime Envirnment)以及一堆Java工具(javac/java/jdb等)和Java基础的类库(即Java API 包括rt.jar)。

但不管是JRE还是JDK都是以JVM为基石的。可以说JVM是java程序可以在某台机器上得以运行的最底层的保障。

2、那么什么是JVM?它的主要作用又是什么?

JVM 是 Java Virtual Machine(Java 虚拟机)的缩写,它的用途简单的说就是它能让我们写的 java 程序在不同的操作系统的不同 CPU 上运行。我们写的 java 程序会利用开发工具(如 Intellij idea)把它编译成.class 文件,但这个 class 文件是不能直接被操作系统识别运行的,需要利用 jvm 按 jvm 规范将编译好的.class 文件转变成机器语言,再交由操作系统提交给 cpu 去执行。

用一句话评价 JVM 的主要作用就是:JVM 屏蔽了与具体操作系统平台相关的信息,使得 Java 程序只需生成在 Java 虚拟机上运行的目标代码(字节码),就可以在多种平台上不加修改地运行。

3、这么牛的 JVM 的核心功能有哪些?

JVM 中核心的功能总体有三块:

  • 类加载器:在 JVM 启动时或者在类运行时将需要的 class 文件加载到 JVM 中
  • 执行引擎:负责执行 class 文件,包括分配运行时数据区(如程序计数器、本地方法栈和虚拟栈)和 最终将 class 中的字节码指令转为机器指令通过操作系统交给 CPU 执行
  • 垃圾回收器:对 JVM 的堆内存进行管理,及时回收调无用的资源释放内存空间

4、JVM 类的加载机制和过程?

首先,我们谈谈开发工具编译生成的 class 文件是如何被 JVM 加载的。所谓的类加载机制其实就是:虚拟机(JVM)把 class 文件加载到内存中,然后对它进行正确性的校验,检查通过再进行解析和初始化,最终把 class 文件变成一个内存中可以直接使用的 java.lang.Class 对象。

从一个 class 文件的装载到销毁,它的生命周期基本可以分为以下五个阶段:装载、链接(验证、准备和解析)、初始化、使用和卸载。

  • 装载:装载 (Load) 阶段总共有三项工作 (1)通过类的全限定名获取其定义的二进制字节流,需要借助类装载器(ClassLoader)完成; (2)在运行时数据区的“方法区”中分配一块区域保存这个类的信息,包括类的基本信息、常量和静态变量等等; (3)在“Java 堆”内存上生成一个该类的 java.lang.Class 对象,用于对外暴露使用该类的入口。
  • 链接:链接(link)阶段同样有三项工作 (1)验证(Verify),验证文件格式、元数据、字节码和符号引用,以保证被加载类的准确性; (2)准备(Prepare),为静态变量分配内存并初始化为默认值。

(3)解析(Resolve),解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用限定符 7 类符号引用进行。

  • 初始化:初始化(Initialize)阶段所做的工作就是对类的静态成员变量和静态方法进行初始化赋值或调用。

比如上面的静态变量 age 初始化之后的值变为了 10。

在装载阶段的第 (2),(3) 步可以发现有运行时数据区,堆,方法区等名词,那么究竟什么是“运行时数据区”,它有哪些结构构成?

5、什么是 JVM 运行时数据区?及其逻辑结构

“运行时数据区”是 JVM 在执行 Java 程序的过程中出于内存管理方面的目的,在设计上把内存分为若干个不同的区域。这些区域有着各自的用途,有的区域生命周期跟虚拟机一样,随着虚拟机进程的启动而存在,伴随这虚拟机的进程结束而消亡。而有些区域则依赖用户线程的启动和结束而建立和销毁。具体如下图:

1、方法区(Method Area):

(1)用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据;

(2)方法区是各个线程共享的内存区域,在虚拟机启动时创建,因为同一个 class 类信息只需要加载一份就够了;

(3)java 虚拟机规范中把方法区描述为堆内存的一个逻辑部分,但它有另外一个别名叫“非堆”,用于与 java 堆区分开来。在 JDK8 之前方法区叫做 Perm space,在 JDK8 及以后叫做 Metaspace(即元数据区)。

2、堆(Heap):Java 堆是被所有线程共享,虚拟机启动时创建,此内存区域唯一的目的就是存放对象实例,在 Java 虚拟机规范中的描述是:所有的对象实例以及数组都要在堆上分配,但是随着 JIT 编译器的发展和逃逸分析技术逐渐成熟,栈上分配,标量替换优化技术将会导致一些微妙的变化发生,所有的对象都分配在堆上也就变得不那么绝对了。

3、虚拟机栈(Java Virtual Machine Stacks):虚拟机栈是线程私有的或者说是独有的,随着线程的创建而创建。一个线程的运行状态(正在调用哪个方法),就是由这个线程对应的虚拟机栈来保存的。

每一个被线程执行的方法,为虚拟机栈中的一个栈帧,调用一个方法,就会向栈中压入一个栈帧;一个方法调用完成,就会把该栈帧从栈中弹出。如下图解:

4、程序计数器(The Pc Register):我们都知道一个 JVM 进程中有多个线程在执行,而线程中的内容是否能够拥有执行权,是根据 CPU 调度来的。假如线程 A 正在执行到某个地方,突然失去了 CPU 的执行权,切换到线程 B 了,然后当线程 A 再获得 CPU 执行权的时候,怎么能继续执行呢?这就是需要在线程中维护一个变量,记录线程执行到的位置,这就是程序计数器。

5、本地方法栈(Native Method Stacks):本地方法栈与虚拟机栈所发挥的作用非常相似,他们之间的区别不过是虚拟机栈为虚拟机执行 Java 方法(字节码)服务,而本地方法栈则为虚拟机中使用到的 native 方法服务。即如果当前线程执行的方法是 Native 类型的,这些方法就会在本地方法栈中执行。

总结一下,就 JVM 的设计规范,从使用用途角度 JVM 的内存大体的分为:线程私有内存区 和 线程共享内存区。

线程私有内存区在类加载器编译某个 class 文件时就确定了执行时需要的“程序计数器”和“虚拟栈帧”等所需的空间,并且会伴随着当前执行线程的产生而产生,执行线程的消亡而消亡,因此“线程私有内存区”并不需要考虑内存管理和垃圾回收的问题。线程共享内存区在虚拟机启动时创建,被所有线程共享,是 Java 虚拟机所管理内存中最应该关注的和最大的一块。

那么 JVM 内存模型是如何设计的?JVM 又是如何进行内存管理(也就是垃圾回收)的?垃圾回收算法有哪些?目前常用的垃圾回收器又有哪些?我会在下篇文章跟您共同解答这些问题。

  • 发表于:
  • 本文为 InfoQ 中文站特供稿件
  • 首发地址https://www.infoq.cn/article/dPlLcDJAuY4jT37qiT9E
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券