一点一滴探究JVM之内存结构

前言

我一直尝试着用不一样的文字来写博客!原因很简单,你讲的知识书上都有,那么每个人为什么不选择看书而选择看你的博文来学习呢?因为书上的内容都是大片大片描述性的文字,对于jvm这块的知识,又是异常枯燥,但又不能不学习的硬骨头!这恰好也就能说明Head First系列的书籍为什么比较火的原因,每个人接收图形知识的速度往往比文字性的东西要快很多。今后我也会尝试用自己的特色来写博客,尽量能引起读者的兴趣,能从中学到东西,我就知足了!

今天的一点一滴探究JVM系列,打算复习一下jvm内存结构!至于学习这块知识的好处?一,从面试的角度来看,你了解jvm,并且java基础扎实,你才更有竞争力(因为我本人本科还没毕业,所以考虑问题经常从面试者的角度来考虑)。其二,提高你对java的理解,知道你创建的每一个对象,每一个变量,都在什么地方,如果不知道这些稀里糊涂得写代码,总会有一天会”翻车”的!好了,废话不多说了,我们开始正题吧!

开始之前

Java与C++之间有一堵由内存动态分配和垃圾收集技术所围成的”墙”, 墙外的人想进去,墙内的人想出来。 或许你经常看到StackOverFlowError, OutOfMemoryError无从下手,因为你压根不知道,究竟是什么东西造成内存爆了,当然,你也无法解决!

举个简单的例子

public class test {
    private int f() {
        f();
    }
    public static void main(String[] args) {
        f();
    }
}

这个简单的递归,不对,它不算是递归,因为没有终止条件,但是你知道它最终会报什么错误,知道为什么会报这个错误吗?究竟是那块内存发生了错误?

这个问题,我们留在后面回答,是留在后面你自己解答,看完这篇博文,不用我说,这些问题你都会很清楚!相信我!

目标

你可能会好奇,你看完这篇文章你能学到什么?

  • 清楚你的对象会被分配在哪里(不绝对)
  • 理解哪些区域对线程来说是私有区,哪些区域是线程共享区域
  • 知道方法调用发生了什么?

等等等,你可能还会解释你以前遇到一些匪夷所思的问题!总之,你如果之前没了解过这些知识,那么这些东西对你来说,就是成长!

墙内的世界

你可能很好奇,墙内究竟是什么样?接下来跟着我一探究竟

上图就是jvm比较详细的内存划分,下面我们来按线程私有共享来划分jvm内存区

下面我们来着重介绍一下这几块内存区域

程序计数器(Program Counter Register)

什么是程序计数器呢,学过汇编的都知道,cs:ip组成的物理地址是下一条要执行的指令的地址,来吧!看图

我们可以很清楚的看到,当前cs:ip指向的内存地址恰好就是我们要执行的下一条指令的位置,前面我们图中(按线程私有共享划分jvm内存的图)又说了,程序计数器是线程私有的,再联想一下我举cs:ip的例子,我们可以很自然的想到,程序计数器其实就是记录线程当前执行到了哪一条指令,因为什么要记录这个值呢?因为,如果我们有很多个线程,线程执行顺序又是不可预料的,假如某一时刻我们在执行线程A里面的指令,然后线程B又获得了cpu的资源,去执行去线程B的指令,假如再过了一段时间之后,A又获得了cpu的资源,想吃回头草,此时回到线程A执行,它不知道要执行线程A的哪条指令!这是没有程序计数器所形成的尴尬局面,但是有了线程私有的程序计数器,这个问题就不存在了,这就是程序计数器出现的原因,以及它的用处,我想你看完这段文字,应该已经对程序计数器这个概念完全理解了!

另外,我需要说明的一点是,程序计数器是Java虚拟机规范中唯一一个没有规定任何内存错误的区域!

虚拟机栈(Vm Stack)

这块区域是干啥的?为啥也是线程私有的?

虚拟机栈描述的是Java方法执行的内存模型 我们来解读这句话,为什么说Vm Stack是描述Java方法执行的内存模型呢?其实:

每个方法执行的时候都会创建一个栈帧(Stack Frame)的东西,学过c/c++的应该都对这个概念熟悉。栈帧用于存储局部变量表、操作数栈、动态链接、方法出口信息等。每个方法从调用开始到结束的过程,都对应这Vm Stack中的入栈出栈的过程!这也就能回答开头我们看到的那个问题了,很简单错误在单线程情况下肯定是StackOverFlowError,多线程下OutOfMemoryError(上图已经写得很清楚了)

比如

public void test() {
    String name = "stormma";
    int age = 21;
}

上面的例子的age变量和name引用都是存储在虚拟机栈的栈帧里面的(因为我们前面说过了,一个方法从开始调用到结束调用的过程都对应着一个Vm Stack出栈入栈的过程)。

我们前面说了,这块区域存储了局部变量表,操作数栈,动态链接,还有方法出口信息等,我想你应该比较好奇这几个概念。

  • 局部变量表: 局部变量表是一组变量值存储空间,用于存放方法参数和方法内部定义的局部变量,其中存放的数据的类型是编译期可知的各种基本数据类型、对象引用(reference)和(returnAddress)类型(它指向了一条字节码指令的地址)。局部变量表所需的内存空间在编译期间完成计算的,即在Java程序被编译成Class文件时,就确定了所需分配的最大局部变量表的容量。当进入一个方法时,这个方法需要在栈中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。
  • 操作数栈: 操作数栈又常被称为操作栈,操作数栈的最大深度也是在编译的时候就确定了。32位数据类型所占的栈容量为1, 64位数据类型所占的栈容量为2。当一个方法开始执行时,它的操作栈是空的,在方法的执行过程中,会有各种字节码指令(比如:加操作、赋值元算等)向操作栈中写入和提取内容,也就是入栈和出栈操作。Java虚拟机的解释执行引擎称为“基于栈的执行引擎”,其中所指的“栈”就是操作数栈。因此我们也称Java虚拟机是基于栈的,这点不同于Android虚拟机,Android虚拟机是基于寄存器的。基于栈的指令集最主要的优点是可移植性强,主要的缺点是执行速度相对会慢些;而由于寄存器由硬件直接提供,所以基于寄存器指令集最主要的优点是执行速度快,主要的缺点是可移植性差
  • 动态链接: 每个栈帧都包含一个指向运行时常量池(在方法区中,后面介绍)中该栈帧所属方法的引用,持有这个引用是为了支持方法调用过程中的动态连接。Class文件的常量池中存在有大量的符号引用,字节码中的方法调用指令就以常量池中指向方法的符号引用为参数。这些符号引用,一部分会在类加载阶段或第一次使用的时候转化为直接引用(如 final、static 域等),称为静态解析,另一部分将在每一次的运行期间转化为直接引用,这部分称为动态连接。
  • 方法返回地址: 当一个方法被执行后,有两种方式退出该方法:执行引擎遇到了任意一个方法返回的字节码指令或遇到了异常,并且该异常没有在方法体内得到处理。无论采用何种退出方式,在方法退出之后,都需要返回到方法被调用的位置,程序才能继续执行。方法返回时可能需要在栈帧中保存一些信息,用来帮助恢复它的上层方法的执行状态。一般来说,方法正常退出时,调用者的PC计数器的值就可以作为返回地址,栈帧中很可能保存了这个计数器值,而方法异常退出时,返回地址是要通过异常处理器来确定的,栈帧中一般不会保存这部分信息。方法退出的过程实际上等同于把当前栈帧出站,因此退出时可能执行的操作有:恢复上层方法的局部变量表和操作数栈,如果有返回值,则把它压入调用者栈帧的操作数栈中,调整PC计数器的值以指向方法调用指令后面的一条指令。

我想关于这个区域的东西我已经介绍完了,我想你也应该懂了。

下面我们来下一个区域: 堆(heap)

堆(Heap)

堆区,是一块很有意思的区域,为啥有意思,因为这块区域是所有线程共享的,也是我们大部分的对象的聚居地(为啥说是大部分呢?这个概念我们之后的文章会进行详细的讲解,如果你特别好奇,可以看一下我之前的文章, Java逃逸分析)!也是jvm管理的最大一块内存(对了,上面的图的大小不代表内存占比,只是为了看着舒服而已)!也是gc开展工作的主要区域。

堆内存中分为一块区域,用于存储类信息,静态变量等等数据,这一块区域之前叫做方法区后面又叫永久带,之后改名叫做Meta-Area/Meta Space Area,元数据空间,名字不重要,我们要清楚这块区域是什么作用就行了!

Meta-Area

这块区域也是线程共享的区域,它主要存储jvm加载类的类信息,类变量,常量(这个在meta-area的常量区),即时编译器编译后的代码等数据。

运行时常量区

这个区域是Meta-Area的一部分,用于存放编译器生成的各种字面量和符号引用,这部分内容将在类加载后存放到方法区的运行时常量池中。这在我们的上一篇博客有所涉及。

枯燥概念性的东西看完之后,我们来看一个例子,来加深一下这块的印象:

public void test() {
    Object obj = new Object();
}

对于这段代码会涉及Vm Stack、Java Heap、Meta-Area三个最重要的内存区域。

结合我们前面的例子,因为test()方法涉及到Vm Stack区,我想你应该明白,obj会存放在局部变量表中,new Object(),我们前面说过我们大部分的对象都会存储在Java Heap这个区域,所以,Java Heap存储了这个实例对象!那么你会很好奇,Meta-Area为啥会涉及到呢?

我们知道Meta-Area存储了类的信息,类变量常量等等东西!因为我们实例化Object对应的时候,要用到Object这个类的信息,所以它会访问Meta-Area的Object.class这个Class对象来获得一些实例化对象需要的东西。

对了,作为补充,我想你还需要知道, obj引用怎么你能访问到Java Heap区的那个实例化对象

有两种方式,一种使用过句柄指针(学过c/c++对这些概念应该会很熟悉)

还有一种就是通过指针直接访问

上图来自深入理解JVM一书

本地方法栈(Native Method Stack)

这块区域相对来说,没有前面几个概念重要。

该区域与虚拟机栈所发挥的作用非常相似,只是虚拟机栈为虚拟机执行Java方法服务,而本地方法栈则为使用到的本地操作系统(Native)方法服务。

比如Java调用c/c++/汇编就用到这块区域

结尾

我想你看完这篇博文,应该达到了我们文章开始之前的目标!这篇文章介绍的比较浅显,本着用例子来解释说明内存区域的作用,这样我想你会更容易接收,总比大片的文字描述让你更有兴趣!如果你有什么建议或者疑惑,可以通过留言联系我!

我有一个微信公众号,经常会分享一些Java技术相关的干货。如果你喜欢我的分享,可以用微信搜索“Java团长”或者“javatuanzhang”关注。

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏gaoqin31

设计模式之 UML

今年接手的一个计费项目让我痛苦不堪,里面到处充斥着重复冗余的代码,一个简单的需求往往需要改n个地方,而且很多改动牵一发动全身,这个项目涉及到支付,出问题就是损失...

562
来自专栏PHP技术

PHP 底层的运行机制与原理

原文出处: nowamagic 欢迎分享原创到伯乐头条 PHP说简单,但是要精通也不是一件简单的事。我们除了会使用之外,还得知道它底层的工作原理。 PHP是...

2857
来自专栏不会写文章的程序员不是好厨师

[翻译]Java 6,7,8中的String.intern

最近一直在关注“故障排查”的相关知识,首先着手的是OOM的异常。OOM异常通常会有Perm区的OOM(java7及以前)和HeapSpace的OOM,这两种各有...

692
来自专栏纯洁的微笑

jvm系列(二):JVM内存结构

所有的Java开发人员可能会遇到这样的困惑?我该为堆内存设置多大空间呢?OutOfMemoryError的异常到底涉及到运行时数据的哪块区域?该怎么解决呢?其实...

3804
来自专栏前端架构

那伤不起的provider们啊~ AngularJS 之 Factory vs Service vs Provider

用AngularJS做项目,但凡用过什么service啊,factory啊,provider啊,开始的时候晕没晕?!晕没晕?!感觉干的事儿都差不多啊,到底用哪个...

841
来自专栏向治洪

JVM体系结构认知

虚拟机 何为虚拟机呢?虚拟机是模拟执行某种指令集体系结构(ISA)的软件,是对操作系统和硬件的一种抽象。其软件模型如下图所示: ? 计算机系统的这种抽象类似于...

1819
来自专栏Linyb极客之路

JVM系列一:JVM内存组成及分配

java内存组成介绍:堆(Heap)和非堆(Non-heap)内存 按照官方的说法:“Java 虚拟机具有一个堆,堆是运行时数据区域,所有类实例和...

3346
来自专栏向治洪

JVM体系结构认知

虚拟机 何为虚拟机呢?虚拟机是模拟执行某种指令集体系结构(ISA)的软件,是对操作系统和硬件的一种抽象。其软件模型如下图所示: ? 计算机系统的这种抽象类...

2708
来自专栏熊二哥

GOF设计模式快速学习

这段时间,学习状态比较一般,空闲时基本都在打游戏,和研究如何打好游戏,终于通过戏命师烬制霸LOL,玩笑了。为了和"学习"之间的友谊小船不翻,决定对以往学习过的G...

1779
来自专栏Golang语言社区

Node.js新手必须知道的4个JavaScript概念

如果只需要知道一种编程语言就可以构建一个全栈的应用程序,是不是特别了不起?Ryan Dahl为了把这个想法成为现实,创造了node.js。Node.js是建立在...

2684

扫码关注云+社区