Java 通过 new 创建对象的过程
当 Java 虚拟机遇到一条字节码指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号的引用,并检查这个符号引用代表的类是否被加载解析和初始化过。如果没有则先执行相应的类加载过程。
在类加载检查通过后,虚拟机便会为新生的对象分配内存。在 Java 堆中,如果内存是规整的,即所有使用过的内存放在一边,未被使用的内存放在另一边,使用指针作为这两个区域的分界点,这时分配内存只需要将指针移动所分配内存大小的距离即可,这种内存分配方式称为“指针碰撞(Bump To Pointer)”
。如果 Java 堆是不规整的,即已使用的内存和空闲的内存相互交错在一起,这时虚拟机就需要维护一个列表,记录那些内存是可用的。在分配时从列表中找一块足够大的空间划分给实例对象,并更新列表上的内容,这种分配方式被称为“空闲列表(Free List)”
由于对象的创建在虚拟机中是非常频繁的,为了避免并发环境下的非线程安全问题,虚拟机可以采用两种方案:一是采用 CAS 配上失败重试方式,保证更新操作的原子性;第二种便是将内存分配划分到不同的空间中进行,即每个线程在 Java 堆中预先分配一小块内存,称为本地线程分配缓冲区(Thread Local Allocation Buffer, TLAB)
,即那个线程要分配内存,就在那个线程的分配缓冲区中进行分配。
对象在堆内存中的存储布局可划分为三个部分,对象头(Header)、实例数据(Instance Data) 和对齐填充(Padding)。
对象头又包括三个部分,MarkWord,元数据指针、数组长度
MarkWord
用于存储对象自身的运行时数据,如 哈希码(HashCode)、GC 分带年龄、锁状态标志、线程持有的锁、偏向锁 id、偏向时间戳(Epoch)等。MarkWord 长度在 32 位和 64 位虚拟机中分别为 32 个比特和 64 个比特。
为了最大成本的节约虚拟机的空间效率,MarkWord 是一个有着动态定义的数据结构,以便在有限空间下存储尽可能多的数据,根据对象的状态复用自己的存储空间。
32位锁标识状态表,分别代表对象在五个不同状态下 32 位虚拟机中 MarkWord 的 32 个标识位究竟存储的是什么内容。
64位锁标识状态表,分别代表对象在五个不同状态下 64 位虚拟机中 MarkWord 的 64 个标识位究竟存储的是什么内容。
类型指针
对象指向它的类型元数据的指针,Java 虚拟机需要通过这个指针来确定该对象是哪个类的实例。
32 位系统中,MarkWord 为 4 个字节 32 位,类型指针也占 4 个字节。而在 64 位系统中 MarkWord 占 8 个字节,类型指针在开启指针压缩的状态下只有 4 个字节,在未开启指针压缩的情况下有 8 个字节,且在 JDK 1.6 之后,指针压缩都是默认开启的。
数组长度 如果对象是一个数组对象便拥有该区域,若不是数组便没有该区域,该区域长度为 4 个字节,用于存储 Java 对象的大小
该区域存储了对象的有效信息,即对象内部的各个类型的字段内容,无论是父类中继承下来的还是子类中定义的字段都必须记录起来。
但是该部分的内存分配策略会受到虚拟机分配策略参数和字段在 Java 源码中定义顺序的影响。HotSpot 虚拟机默认的分配顺序为 longs/doubles、ints、shorts/charts、bytes/booleans、oops。
第三部分对齐填充并不是必然存在的,并无特殊意义,知识因为在 虚拟机中内存管理要求所有对象的其实地址必须是 8 字节的整数倍,因此对象的大小也为 8 字节的整数倍。
Java 程序会根据栈上的 reference 数据来操作堆上的具体对象。而 reference 访问到 Java 堆上的对象主要有使用句柄
和直接指针
两种方式。
Java 堆中会划分出一块内存作为句柄池,reference 中存储的对象就是句柄池地址,句柄池中包含了对象的实例数据与类型数据各自具体的地址信息。
该方法的优点是句柄池中的句柄地址是稳定的,在对象被移动(垃圾回收时)时,只会改变句柄池中对象实例指针的地址,而 reference 本身不需要被修改。
reference 中存储的直接就是实例对象的地址,有关于对象类型的地址则被放入到实例对象中。
直接指针的优点在于速度快,它节省了一次指针定位的开销,在只需访问对象中的实例内容时,不需要多一次的间接访问开销。