jvm入门2：3-5运行时数据区+程序技术器+虚拟机栈

原创

用户10832809

发布于 2025-02-24 12:30:45

1290

03 运行时数据区概述和线程

概述

内存是非常重要的系统资源，是硬盘和CPU的中间仓库及桥梁，承载着操作系统和应用程序的实时运行。jvm内存布局规定了java在运行过程中内存申请、分配、管理的策略，保证了jvm的高效稳定运行。不同的jvm对于内存的划分方式和管理机制存在着部分差异

java虚拟机定义了若干种程序运行期间会使用到的运行时数据区，其中有一些会随着虚拟机启动而创建，随着虚拟机退出而销毁。另外一些则是线程一一对应的，这些线程对应的数据区域会随着线程开始和结束而创建和销毁

灰色为单独线程私有的，红色为多个线程共享的，即每个线程：独立包括程序技术器、栈、本地方法栈；线程共享：堆、堆外内存（永久代或元空间、代码缓存）

每个jvm只有一个Runtime实例，即运行时环境，相当于内存结构的中间那个框，运行时环境

线程

线程是一个程序里的运行单元，jvm允许一个应用有多个线程并行的执行

在hotspot jvm中，每个线程都与操作系统的本地线程直接映射。当一个java线程准备好执行以后，此时一个操作系统的本地线程也同时创建。java线程执行终止后，本地线程也会回收

操作系统负责所有线程的安排调度到任何一个可用的cpu上，一旦本地线程初始化成功，它就会调用java线程的run方法

jvm系统线程

使用jconsole或者任何一个调试工具，都能看到后台有许多线程在运行。这些后台线程不包括调用puiblic static void main()方法的main线程，以及所有main线程自己创建的线程

在hotspot jvm中，主要的后台线程为下面几个：

1虚拟机线程，这些线程的操作需要jvm达到安全点才会出现，这些操作必须在不同的线程中发生的原因是他们都需要jvm达到安全点，这样堆才不会发生变化。这种线程的执行类型包括 stop-the-world 的垃圾回收，线程栈收集，线程挂起以及偏向锁撤销

2周期任务线程：这种线程是时间周期事件的体现（如中断），他们一般用于周期性操作的调度执行

3GC线程：这种线程对在jvm里不同种类的垃圾收集行为提供了支持

4编译线程：在运行时会将字节码编译成本地代码

5信号调度线程：这种线程接收信号并发送给jvm，在它内部通过调用适当方法进行处理

04-程序计数器

介绍

jvm中的程序计数器 program counter register，register的命名源于cpu寄存器，寄存器存储指令相关的现场信息。cpu只有把数据装载到寄存器才能够运行。这里，并非是广义上所指的物理寄存器，或许将其翻译为pc计数器（或指令计数器）会更加贴切一些（也称程序钩子）。jvm中的pc寄存器是对物理pc寄存器的一种抽象模拟

pc寄存器用来存储指向下一条指令的地址，对应即将执行的指令代码，由执行引擎读取下一条指令

特点：

1是一块很小的内存区域，几乎可以忽略不计。也是运行速度最快的存储区域。

2在jvm规范中，每个线程都有它自己的程序计数器，是线程私有的，声明周期与线程的生命周期保持一致；

3任何时间一个线程都只有一个方法在执行，也就是所谓的当前方法。程序计数器会存储当前线程正在执行的java方法的jvm指令地址，或者如果是在执行native方法时，则是未指定值

4是程序控制流的指示器，分支、循环、跳转、异常处理、线程回复等基础功能都依赖于这个计数器完成

5字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令

6唯一一个在java虚拟机规范中没有规定任何outofmemoryerror情况的区域

使用pc集群器存储字节码指令地址有什么用？为什么使用pc寄存器记录当前线程的指令地址？

cpu需要不停的切换各个线程，切换回来的时候，知道接着从哪里继续执行；jvm字节码解释器需要通过改变pc寄存器的值明确下一条应该执行什么样的字节码指令

pc寄存器为什么会被设定为线程私有？

准确记录各个线程正在执行的当前字节码指令地址，是为每一个线程分配一个pc寄存器，各线程之间可以独立计算，不相互干扰；cpu时间片限制，每个处理器内核在一个确定的时刻只执行一条指令，经常的中断和回复，通过线程的程序计数器和栈帧保证线程间互不干扰

05 虚拟机栈

概述

内存中栈和堆，栈时运行时的单位，堆是存储的单位。即栈解决程序的运行问题，程序如何执行，如何处理数据。对解决数据的存储问题，数据怎么放，放哪？

java虚拟机栈是什么？

每个线程在创建时都会创建一个虚拟机栈，其内部保存一个个的栈帧stack frame，对应着一个个java方法调用；

线程私有；生命周期与线程一致；

主管java程序的运行，保存方法的局部变量，部分结果，并参与方法的调用和返回

特点：栈是一种快速有效的分配存储方式，访问速度仅次于程序计数器；jvm对java栈的操作只有两个，每个方法执行，进栈；执行结束后，出栈；栈没有垃圾回收问题

开发者遇到的异常有哪些

栈中可能出现的异常：java虚拟机规范允许java栈的大小是动态的，或固定不变；如果采用固定大小的栈，每一个线程的在线程创建时选定，线程请求分配的栈容量超过了允许的最大容量，抛出stackOverflowError；2栈可以动态扩展，尝试扩展的时候无法申请到足够的内存，或在创建新线程时没有足够的内存创建虚拟机栈，会抛出outOfMemoryError

设置栈内存大小，使用参-Xss设置线程的最大栈空间，栈的大小直接决定了函数调用的最大可达深度

栈的存储单位

栈中存储什么？

1每个线程都有自己栈，栈中的数据都以栈帧的格式存在；2线程上正在执行的每个方法都对应一个栈帧；3栈帧是一个内存区块，一个数据集，维系着方法执行过程中的各种数据信息

栈运行原理

1jvm直接对栈的操作只有两个，入栈出栈，先进后出或后进先出原则；2一条活动线程中，一个时间点上，只会有一个活动的栈帧。只有当前正在执行的方法的栈帧是有效的，这个栈帧被称为当前栈帧，与当前栈帧对应的方法是当前方法，定义这个方法的类是当前类。3执行引擎运行的所有字节码的指令只针对当前栈帧进行操作；4如果在该方法中调用了其他方法，对应的新栈帧会被创建出来，放在栈的顶端，称为新的当前帧

5不同线程中所包含的栈帧不允许存在相互引用，即不可能在一个栈帧中引用另一个线程的栈帧；6如果当前方法调用了其他方法，方法返回之际，当前栈帧会传回此方法的执行结果给前一个栈帧，当前栈帧丢弃，前一个栈帧重新成为当前栈帧；7java方法有两种返回函数的方式，一种是正常的函数返回，使用return指令；一种是抛出异常，不管哪种方式都会导致栈帧被弹出。

栈帧内部结构：1局部变量表 local variables；2操作数栈 operand stack（或表达式栈）；3动态链接 dynamic linking（指向运行时常量池的方法引用）；4 方法返回地址 return address（方法正常或异常退出的定义）；5附加信息

局部变量表

1也称为局部变量数组，本地变量表；2定义为一个数字数组，存储方法参数和定义在方法体内的局部变量，这些数据类型包括各类基本数据类型，数据引用（reference）、returnAddress类型；3由于局部变量表示建立在线程的栈上，线程的私有数据，不存在数据安全问题；4局部变量表所需的容量大小是编译期确定下来的，并保存在方法的code属性maximum local variables数据项中。在方法运行期间不会改变局部变量表的大小

5方法嵌套的次数由栈的大小决定。一般来说，栈越大，方法嵌套调用的次数越多；函数的参数和局部变量越多，局部变量表膨胀，栈帧越大，以满足方法调用所需传递的信息增多的需求。进而函数调用就会占用更多的栈空间，导致其嵌套调用次数就会减少

6局部变量表中的变量只在当前方法调用中有效。在方法执行时，虚拟机通过使用局部变量表完成参数值带参数变量列表的传递过程。当方法调用结束后，随着方法栈帧的销毁，局部变量表也随之销毁

slot理解

1参数值的存放总是在局部变量数组的index0开始，到数组长度-1的索引结束；2局部变量表，最基本的存储单元是slot（变量槽）；3局部变量表中存放编译器可知的各种基本数据类型（8种），引用类型（reference）,returnAddress类型的变量；4在局部变量表中，32位以内的类型只占用一个slot（包括returnAddress类型），64位的类型（long和double）占用两个slot。byte、short、char在存储前被转换为int，boolean也被转换为int，0为false，非0为true

3jvm会为局部变量表中的每一个slot都分配一个访问索引，通过这个索引即可成功访问到局部变量表中指定的局部变量值；4当一个实例方法被调用的时候，它的方法参数和方法内部定义的局部变量会按照顺序被复制盗局部变量表的一个slot上；5如果需要访问局部变量表中一个64bit的局部变量值时，只需要使用一个索引即可；6如果当前帧是由构造方法或者实例方法创建的，该对象引用this将会存放在index为0的slot处，其余参数按照参数顺序继续排列

slot重复利用

栈帧中的局部变量表的槽位是可以重用的，如果一个局部变量表过了其作用域，那么在其作用域之后申明新的局部变量就很有可能会复用过期局部变量的槽位，从而达到节省资源的目的。

静态变量表与局部变量的对比

1参数表分配完毕后，再根据方法体内定义的变量顺序和作用域分配；2类变量表有两次初始化机会，第一次是在准备阶段，执行系统初始化，对类变量设置零值，另一次是在初始化阶段，赋予程序员在代码中定义的初始值；3和类变量初始化不同的是，局部变量表不存在系统初始化过程，意味着一旦定义了局部变量则必须认为的初始化，否则无法使用。

补充

在栈帧中，与性能调优关系最为密切的部分为前面提到的局部变量表。在方法执行时，虚拟机使用局部变量表完成方法的传递；

2局部变量表中的变量也是重要的垃圾回收根节点，只要被局部变量表中直接或间接引用的对象都不会被回收

操作数栈

1每一个独立的栈帧中除了包含局部变量表之外，还包含一个后进先出的操作数栈，也称为表达式栈；2操作数栈，在方法执行过程中，根部字节码指令，往栈中写入数据或提取数据，即入栈出栈；3某些字节码指令将值压入操作数栈，其余的字节码指令将操作数取出栈。使用它们后再把结果压入栈，如复制、交换、求和等操作

定义

1主要保存计算过程的中间结果，同时作为计算过程中变量临时的存储空间；

2操作数栈就是jvm执行引擎的一个工作区，当一个方法刚开始执行时，一个新的栈帧也会随之被创建出来，这个方法的操作栈是空的；

3每一个操作数栈都会拥有一个明确的栈深度用于存储数值，其所需的最大深度在编译器就定义好了，保存在方法的code属性中，为max_stack的值

4栈中的任何一个元素可以是任意的java数据类型，32bit的类型占用一个栈单位深度，64bit的占两位

5操作数栈并非采用访问索引的方式来进行数据访问，只能通过标准的入栈和出栈的操作完成一次数据访问

6如果被调用的方法带有返回值的话，其返回值将会被压入当前栈帧的操作数栈中，并更新pc寄存器中的下一条需要执行的字节码指令

7操作数栈中元素的数据类型必须与字节码指令的序列严格匹配，这由编译器在编译期间进行验证，同时在类加载过程中的类检验阶段的数据流分析阶段再次验证

8java虚拟机栈的引擎是基于栈的执行引擎，其中栈指的是操作数栈

代码追踪

使用javap命令反编译class文件：javap -v 类名.class

栈顶缓存技术 top-of-stack cashing

基于栈式架构的虚拟机所使用的零地址指令更紧凑，但需要更多的入栈出栈指令，指令分派（instruction dispatch）次数和内存读写次数。操作数是存储在内存中的，频繁执行内存读/写操作会影响执行速度。为解决这个问题，将栈顶元素全部缓存到物理cpu的寄存器中，以此降低对内存的读写次数，提升执行引擎的执行效率

动态链接

指向运行时常量池的方法引用。1每个栈帧内部都包含一个指向运行时常量池中该栈帧所属方法的引用，包含这个引用的目的是为了支持当前方法的代码能够实现动态链接，如invokedynamic；2java源文件被编译到字节码文件中时，所有的变量和方法引用都作为符号引用保存在class文件的常量池中。如描述一个方法调用了另外的其他方法时，通过常量池中指向方法的符号引用来表示的，动态链接的作用是为了将这些符号引用转换为调用方法的直接引用

常量池，提供一些符号和常量，便于指令识别

方法的调用

jvm中，将符号引用转换为调用方法的直接引用与方法的绑定机制有关；2静态链接，当一个字节码文件被装载进jvm内部时，如果被调用的目标方法在编译期可知，且运行期保持不变。这种情况下将调用方法的符号引用转换为直接引用的过程称为静态链接；3动态链接，如果被调用的方法在编译器无法被确定下来，只能够在程序运行期将调用方法的符号引用转向直接引用

对应的方法绑定机制：早期绑定和晚期绑定， early binding and late binding。绑定的是一个字段、方法或者类在符号引用被替换为直接引用的过程，这仅发生一次。

早期绑定，指被调用的目标方法如果在编译器可知，且运行期保持不变时，即可将这个方法与所属的类型进行绑定，由于明确了被调用的目标方法究竟是哪一个，可以使用静态链接的方式将符号引用转换为直接引用

晚期绑定：无法在编译器确定，程序运行期间绑定

非虚方法，编译期间就确定了具体的调用版本，运行时不可变，如静态方法、私有方法、final方法、实例构造器、父类方法；其他方法为虚方法

虚拟机中方法调用指令

普通调用指令

invokestatic 调用静态方法，解析阶段确定唯一方法版本

invokespecial 调用init方法、私有及父类方法，解析阶段确定唯一方法版本

invokevirtual 调用所有虚方法

invokeinterface 调用接口方法

动态调用指令

invokedynamic 动态解析出需要调用的方法，执行

前四条指令固化在虚拟机内部，方法的调用执行不可人为干预，而invokedynamic指令则支持由用户确定方法版本。invokestatic和invokespecial为非虚方法调用

invokedynamic指令，java8的lambda表达式出现，该指令才生成

静态语言判断变量自身类型信息。动态语言判断变量值的类型信息，变量没有类型信息，变量值才有类型信息。

方法重写的本质：1找到了操作数栈顶的第一个元素所执行的对象的实际类型，记作C；2如果在类型C中找到与常量在的描述符合简单名称都相符的方法，则进行访问权限校验，如果通过则放回这个方法的直接引用，查找过程结束；不通过，则返回java.lang.IllegalASccessError异常；3否则，按照继承关系从下往上依次对C的父类进行第二步的搜索和验证过程；4如果始终没有找到合适的方法，则抛出java.lang.AbstractMethodError异常

IllegalAcessError:程序试图访问或修改一个属性或调用一个方法，这个属性或方法，没有权限访问。引起编译器异常，错误如果发生在运行，说明一个类发生了不兼容改变

虚方法表

面向对象的编程中，会很频繁的使用动态分派，如果在每次动态分派过程中都要重新在类的方法元数据在搜索合适的目标的话就可能影响到执行效率。为提高性能，jvm采用在类的方法区建立一个虚方法表来实现。使用索引表替代查找；2每个类在都有一个虚方法表，存放着各个方法的实际入口；3虚方法在不类加载的链接阶段创建并完成初始化，类的变量初始值准备完成后，jvm会把该类的方法也初始化完毕

方法返回地址

1存放调用该方法的pc寄存器的值；2一个方法的结束，两种方式，正常执行完成，异常退出；3无论哪种方式退出，都返回到该方法被调用的位置。正常退出时，调用者的pc计数器的值作为返回地址，及调用该方法的指令的下一条指令的地址；通过异常退出的，返回地址是通过异常表确定，栈帧中不保存这部分信息。

本质上，方法的退出就是当前栈帧出栈的过程，需要恢复上层方法的局部变量表、操作数栈、将返回值压入调用栈帧的操作数栈，设置pc器值，调用者方法继续执行下去。正常异常区别在于，通过异常完成的出口退出，不会给他的上层调用者产生任何返回值

字节码中返回指令包含，ireturn(返回值为boolean、byte、char、short、int类型时使用)，lreturn、freturn、dreturn、areturn、return（返回void、实例化初始方法、类和接口的初始化方法）

面试题

举例栈溢出的情况（stackoverfowerror，通过-Xss设置栈的大小，OOM）

调整栈大小，就能保证不出现移除吗 --不能

分配的栈内存越大越好吗？--不是

垃圾回收是否会涉及到虚拟机栈--不会

方法中定义的局部变量是否线程安全？具体问题具体分析

b站：康师傅jvm

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

jvm

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

jvm

登录后参与评论

0 条评论

热度