前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >《深入理解java虚拟机》String.intern()探究

《深入理解java虚拟机》String.intern()探究

作者头像
明明如月学长
发布2021-08-27 16:12:57
4480
发布2021-08-27 16:12:57
举报

一、背景

《深入理解java虚拟机》第二版 57页对String.intern()返回引用的测试代码如下:

代码语言:javascript
复制
/** String的intern例子
 * Created by 明明如月 on 2017-05-24.
 */
public class RuntimeConstantPoolOOM {
    public static void main(String[] args) {
        String str1 = new StringBuilder("计算机").append("软件").toString();
       // String str3= new StringBuilder("计算机软件").toString();
        System.out.println(str1.intern() == str1);
        String str2 = new StringBuilder("Java(TM) SE ").append("Runtime Environment").toString();
        System.out.println(str2.intern() == str2);
    }
}

结果是 :

true

false

可能很多人觉得这个结果很奇怪,在这里我们进行深入地探究。


二、解释

书中写道,如果JDK1.6会返回两个false,JDK1.7运行则会返回一个true一个false。

因为JDK1.6中,intern()方法会把首次遇到的字符串实例复制到永久代中,返回的也是永久代中这个字符串的实例的引用,而StringBulder创建的字符串实例在Java堆上,所以必然不是同一个引用,将返回false。

在JDK1.7中,intern()的实现不会在复制实例,只是在常量池中记录首次出现的实例引用,因此返回的是引用和由StringBuilder.toString()创建的那个字符串实例是同一个。

str2的比较返回false因为"java"这个字符串在执行StringBuilder.toString()之前已经出现过,字符串常量池中已经有它的引用了,不符合“首次出现”的原则,而“计算机软件”这个字符串是首次出现,因此返回true。


三、追溯

那么就有疑问了,这个“java”字符串在哪里出现过呢?显然并不是直接出现在这个类里面。

我们分别打开String 、StringBuilder和System类的源码看看有啥发现,

其中在System类里发现

《深入理解java虚拟机》String.intern()探究
《深入理解java虚拟机》String.intern()探究

根据注释可以看出来,System是由虚拟机自动调用的。

《深入理解java虚拟机》String.intern()探究
《深入理解java虚拟机》String.intern()探究

在initializeSystemClass 方法中发现调用了Version对象的init静态方法

《深入理解java虚拟机》String.intern()探究
《深入理解java虚拟机》String.intern()探究

而Version类里 laucher_name是私有静态字符串常量

《深入理解java虚拟机》String.intern()探究
《深入理解java虚拟机》String.intern()探究

因此sun.misc.Version 类会在JDK类库的初始化过程中被加载并初始化,而在初始化时它需要对静态常量字段根据指定的常量值(ConstantValue)做默认初始化,此时被 sun.misc.Version.launcher 静态常量字段所引用的"java"字符串字面量就被intern到HotSpot VM的字符串常量池——StringTable里了。

因此我们修改一下代码:

代码语言:javascript
复制
String str2 = new StringBuilder("Java(TM) SE ").append("Runtime Environment").toString(); System.out.println(str2.intern() == str2)

发现结果还是false

从而更加证实了我们的猜测。

四、方法

可能有些人会说,我咋知道 System 静态代码块中会初始化这个字符串呢?

办法很多

4.1  打印加载的类

使用:-XX:+TraceClassLoading 虚拟机参数打印类的加载顺序

// 前后省略了很多 [Loaded java.lang.reflect.Type from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar] [Loaded java.lang.Class from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar] [Loaded java.lang.Cloneable from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar] [Loaded java.lang.ClassLoader from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar] [Loaded java.lang.System from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar] [Loaded java.lang.Throwable from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar] [Loaded java.lang.Error from /Library/Java/JavaVirtualMachines/jdk1.8.0_202.jdk/Contents/Home/jre/lib/rt.jar]

我们看到加载到了System类,因此可以进去看看,发现可能是这里。

4.2 调试法

随便找一个简单的程序打个断点,然后右下角 memory选项卡找到String

双击字符串,输入 "java".equals(this),即可查看已经构造的字符串对象

或者直接在String的 value数组上加上如下条件断点:

最终发现是通过这个函数构造的:

五、总结

再遇到类似问题的时候,希望大家可以多从源码角度去追本溯源,能够多分享出来。

六、答疑


有朋友问为啥

代码语言:javascript
复制
String string1 = new StringBuilder("tests").toString(); 

System.out.println(string1.intern() == string1); 

的结果是false?

首先 "tests" 本身是字符串字面量默认是 intern 的,假设引用为 abc。

而字符串string1 为  StringBuilder#toString 大家可以看下源码,这里返回的是新的字符串对象,假设引用是 def。

代码语言:javascript
复制
 @Override
    public String toString() {
        // Create a copy, don't share the array
        return new String(value, 0, count);
    }

显然  string1.intern 引用为  abc, string1的引用为 def 显然不是同一个对象。

有些人会问,你咋知道  字符串字面量就 Intern的呢?

在这里特别强调大家一定一定要自己主动去看源码,而不是等着别人来教你。其次看源码一定一定要看注释。

代码语言:javascript
复制
   /**
     * Returns a canonical representation for the string object.
     * 
     * A pool of strings, initially empty, is maintained privately by the
     * class {@code String}.
     * 
     * When the intern method is invoked, if the pool already contains a
     * string equal to this {@code String} object as determined by
     * the {@link #equals(Object)} method, then the string from the pool is
     * returned. Otherwise, this {@code String} object is added to the
     * pool and a reference to this {@code String} object is returned.
     * 
     * It follows that for any two strings {@code s} and {@code t},
     * {@code s.intern() == t.intern()} is {@code true}
     * if and only if {@code s.equals(t)} is {@code true}.
     * 
     * All literal strings and string-valued constant expressions are
     * interned. String literals are defined in section 3.10.5 of the
     * The Java™ Language Specification.
     *
     * @return  a string that has the same contents as this string, but is
     *          guaranteed to be from a pool of unique strings.
     */
    public native String intern();

这里讲到

All literal strings and string-valued constant expressions are interned. 所有的字符串字面量(如"abc")和字符串常量表达式(如 "a"+"bc")都是 interned 的。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017-05-25 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、背景
  • 二、解释
  • 三、追溯
  • 四、方法
    • 4.1  打印加载的类
      • 4.2 调试法
      • 五、总结
      • 六、答疑
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档