前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >JVM-字符串底层实现原理

JVM-字符串底层实现原理

作者头像
用户7353950
发布2022-05-11 10:50:48
2370
发布2022-05-11 10:50:48
举报
文章被收录于专栏:IT技术订阅

什么字符串会进入字符串常量池

1. 直接写的字面量

2. 字面量的拼接结果(注意:如果字符串拼接中有变量则结果不会进入字符串常量池)

3. 调用String的intern方法可以将String存入字符串常量池

字面量的拼接原理

有如下示列代码

代码语言:javascript
复制
package com.hgy;
import java.util.Arrays;
import java.util.List;
public class hello {
public static void main(String[] args) {
String a = "hello" + " world";
}
}

在idea中查看编译后的class文件

代码语言:javascript
复制
//
// Source code recreated from a .class file by IntelliJ IDEA
// (powered by Fernflower decompiler)
//
package com.hgy;
public class hello {
public hello() {
}
public static void main(String[] args) {
String a = "hello world";
}
}

结论:

以上面两个文件我们可以看出,这种字符串的拼接在编译期间就已经优化了,直接就合并为一个字符串;并且这个字符串存放在字符串常量池

字符串和变量拼接原理

java源码

代码语言:javascript
复制
package com.hgy;
import java.util.Arrays;
import java.util.List;
public class hello {
public static void main(String[] args) {
String v = "java";
String a = v + "hello" + " world";
}
}

利用jclasslib查看main方法的字节码命令

如果一下名词不明白请阅读请自行了解学习java虚拟机栈

我们可以发现就简单的两行代码,产生了这么多的字节码命令;在代码中我简单解释了每一行的作用,

代码语言:javascript
复制
0 ldc #2 <java> // 从字符串常量池加载java
2 astore_1 // 存储常量到索引为1的局部变量表中
3 new #3 <java/lang/StringBuilder> //给StringBuilder对象分配内存空间
6 dup
7 invokespecial #4 <java/lang/StringBuilder.<init>> //执行StringBuilder的构
造方法
10 aload_1 //获取局部变量表索引为1的引用地址,
11 invokevirtual #5 <java/lang/StringBuilder.append> //把上面加载的内容作为参数
传递给append方法
14 ldc #6 <hello world> // 从字符串常量池加载hello world
16 invokevirtual #5 <java/lang/StringBuilder.append> //把上面加载的内容作为参数
传递给append方法
19 invokevirtual #7 <java/lang/StringBuilder.toString> //调用toString方法
22 astore_2 //结果存储到局部变量表
23 return

以上内容我们可以知道字符串拼接实际上就是创建了一个StringBuilder对象然后向里面append内容,最后调用toString方法获得结果

3.1 为什么结果没有存储在常量池

从上述字节码指令已经知道了字符串拼接结果是StringBuilder的toString方法的结果,那么toString里面具体做了什么事情,又是为什么结果不在常量池?

一下是StringBuilder.toString的源码以及字节码指令

代码语言:javascript
复制
@Override
public String toString() {
// Create a copy, don't share the array
//此处value为一个char数组【我的jdk版本为jdk8】
return new String(value, 0, count);
}
0 new #80 <java/lang/String>
3 dup
4 aload_0
5 getfield #234 <java/lang/StringBuilder.value>
8 iconst_0
9 aload_0
10 getfield #233 <java/lang/StringBuilder.count>
13 invokespecial #291 <java/lang/String.<init>>
16 areturn

以上代码可以很好的解释实际上最终是调用了String的构造方法传入一个char数组,那么最终的结果肯定也就在咱么的堆空间

为什么字符串拼接效率低

4.1. 源码准备

首先编写两个方法一个使用字符串拼接,一个使用StringBuilder进行拼接;

代码语言:javascript
复制
public class hello {
public void concatStrByDefault() {
String basic = "name ";
for (int i = 0; i < 100; i++) {
basic += i;
}
System.out.println(basic);
}
public void concatStrByBuilder() {
StringBuilder basic = new StringBuilder("name ");
for (int i = 0; i < 100; i++) {
basic.append(i);
}
System.out.println(basic.toString());
}
}

4.2.字节码指令层面解析

一上代码的执行时间长短我就不在重复测试了相信大家都会,接下来我们来一起看看这两个方法字节码指令

concatStrByDefault方法的字节码指令如下

简单解释下循环是在33行的goto指令调到第5行这样不断循环;并且在11行也就是循环中不断的通过new创建了StringBuilder对象,也就是循环了多少次就创建了多少个StringBuilder

对象,并且如果大家看了我之前写字符串拼接原理,在StringBuilder的toString方法中还new了一个String对象;这里这么多对象的创建就必然需要垃圾回收效率自然就低了

代码语言:javascript
复制
0 ldc #2 <name >
2 astore_1
3 iconst_0
4 istore_2
5 iload_2
6 bipush 100
8 if_icmpge 36 (+28)
11 new #3 <java/lang/StringBuilder>
14 dup
15 invokespecial #4 <java/lang/StringBuilder.<init>>
18 aload_1
19 invokevirtual #5 <java/lang/StringBuilder.append>
22 iload_2
23 invokevirtual #6 <java/lang/StringBuilder.append>
26 invokevirtual #7 <java/lang/StringBuilder.toString>
29 astore_1
30 iinc 2 by 1
33 goto 5 (-28)
36 getstatic #8 <java/lang/System.out>
39 aload_1
40 invokevirtual #9 <java/io/PrintStream.println>
43 return

concatStrByBuilder方法的字节码指令

此处循环在27行的goto指令跳到12行,并且循环之间是没有创建新对象的,紧紧只是调用了append方法,这里就能很明显的看出这种方式比普通拼接少创建了很多的对象

代码语言:javascript
复制
0 new #3 <java/lang/StringBuilder>
3 dup
4 ldc #2 <name >
6 invokespecial #10 <java/lang/StringBuilder.<init>>
9 astore_1
10 iconst_0
11 istore_2
12 iload_2
13 bipush 100
15 if_icmpge 30 (+15)
18 aload_1
19 iload_2
20 invokevirtual #6 <java/lang/StringBuilder.append>
23 pop
24 iinc 2 by 1
27 goto 12 (-15)
30 getstatic #8 <java/lang/System.out>
33 aload_1
34 invokevirtual #7 <java/lang/StringBuilder.toString>
37 invokevirtual #9 <java/io/PrintStream.println>
40 return

4.3. 总结

拼接效率低的主要原因也就是每一次拼接都创建了一个StringBuilder对象,并且在赋值是又需要调用toString方法,而toString方法的实现里面有new了一个String对象,所以拼接的效率很低。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-05-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 IT技术订阅 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档