《深入理解java虚拟机》第二版 57页对String.intern()返回引用的测试代码如下:
/** String的intern例子
* Created by 明明如月 on 2017-05-24.
*/
public class RuntimeConstantPoolOOM {
public static void main(String[] args) {
String str1 = new StringBuilder("计算机").append("软件").toString();
// String str3= new StringBuilder("计算机软件").toString();
System.out.println(str1.intern() == str1);
String str2 = new StringBuilder("Java(TM) SE ").append("Runtime Environment").toString();
System.out.println(str2.intern() == str2);
}
}
结果是 :
true
false
可能很多人觉得这个结果很奇怪,在这里我们进行深入地探究。
书中写道,如果JDK1.6会返回两个false,JDK1.7运行则会返回一个true一个false。
因为JDK1.6中,intern()方法会把首次遇到的字符串实例复制到永久代中,返回的也是永久代中这个字符串的实例的引用,而StringBulder创建的字符串实例在Java堆上,所以必然不是同一个引用,将返回false。
在JDK1.7中,intern()的实现不会在复制实例,只是在常量池中记录首次出现的实例引用,因此返回的是引用和由StringBuilder.toString()创建的那个字符串实例是同一个。
str2的比较返回false因为"java"这个字符串在执行StringBuilder.toString()之前已经出现过,字符串常量池中已经有它的引用了,不符合“首次出现”的原则,而“计算机软件”这个字符串是首次出现,因此返回true。
那么就有疑问了,这个“java”字符串在哪里出现过呢?显然并不是直接出现在这个类里面。
我们分别打开String 、StringBuilder和System类的源码看看有啥发现,
其中在System类里发现
根据注释可以看出来,System是由虚拟机自动调用的。
在initializeSystemClass 方法中发现调用了Version对象的init静态方法
而Version类里 laucher_name是私有静态字符串常量
因此sun.misc.Version 类会在JDK类库的初始化过程中被加载并初始化,而在初始化时它需要对静态常量字段根据指定的常量值(ConstantValue)做默认初始化,此时被 sun.misc.Version.launcher 静态常量字段所引用的"java"字符串字面量就被intern到HotSpot VM的字符串常量池——StringTable里了。
因此我们修改一下代码:
String str2 = new StringBuilder("Java(TM) SE ").append("Runtime Environment").toString(); System.out.println(str2.intern() == str2)
发现结果还是false
从而更加证实了我们的猜测。
可能有些人会说,我咋知道 System 静态代码块中会初始化这个字符串呢?
办法很多
使用:-XX:+TraceClassLoading 虚拟机参数打印类的加载顺序
// 前后省略了很多 [Loaded java.lang.reflect.Type from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar] [Loaded java.lang.Class from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar] [Loaded java.lang.Cloneable from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar] [Loaded java.lang.ClassLoader from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar] [Loaded java.lang.System from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar] [Loaded java.lang.Throwable from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar] [Loaded java.lang.Error from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]
我们看到加载到了System类,因此可以进去看看,发现可能是这里。
随便找一个简单的程序打个断点,然后右下角 memory选项卡找到String
双击字符串,输入 "java".equals(this),即可查看已经构造的字符串对象
或者直接在String的 value数组上加上如下条件断点:
最终发现是通过这个函数构造的:
再遇到类似问题的时候,希望大家可以多从源码角度去追本溯源,能够多分享出来。
有朋友问为啥
String string1 = new StringBuilder("tests").toString();
System.out.println(string1.intern() == string1);
的结果是false?
首先 "tests" 本身是字符串字面量默认是 intern 的,假设引用为 abc。
而字符串string1 为 StringBuilder#toString 大家可以看下源码,这里返回的是新的字符串对象,假设引用是 def。
@Override
public String toString() {
// Create a copy, don't share the array
return new String(value, 0, count);
}
显然 string1.intern 引用为 abc, string1的引用为 def 显然不是同一个对象。
有些人会问,你咋知道 字符串字面量就 Intern的呢?
在这里特别强调大家一定一定要自己主动去看源码,而不是等着别人来教你。其次看源码一定一定要看注释。
/**
* Returns a canonical representation for the string object.
*
* A pool of strings, initially empty, is maintained privately by the
* class {@code String}.
*
* When the intern method is invoked, if the pool already contains a
* string equal to this {@code String} object as determined by
* the {@link #equals(Object)} method, then the string from the pool is
* returned. Otherwise, this {@code String} object is added to the
* pool and a reference to this {@code String} object is returned.
*
* It follows that for any two strings {@code s} and {@code t},
* {@code s.intern() == t.intern()} is {@code true}
* if and only if {@code s.equals(t)} is {@code true}.
*
* All literal strings and string-valued constant expressions are
* interned. String literals are defined in section 3.10.5 of the
* The Java™ Language Specification.
*
* @return a string that has the same contents as this string, but is
* guaranteed to be from a pool of unique strings.
*/
public native String intern();
这里讲到
All literal strings and string-valued constant expressions are interned. 所有的字符串字面量(如"abc")和字符串常量表达式(如 "a"+"bc")都是 interned 的。