前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Java-String那些事

Java-String那些事

作者头像
贾博岩
发布2018-05-11 15:51:19
5450
发布2018-05-11 15:51:19
举报
文章被收录于专栏:博岩Java大讲堂博岩Java大讲堂

Java-String那些事

String对于广大程序员来说,并不陌生,是我们在编写程序中经常使用到的对象。但是,你真的对String了解吗,使用的方式对吗?

接下来,笔者就对String来进行全面的解析,让你对String有更深入的了解!

更重要的是,面试的时候,虐虐面试官!

String源码(截取)

public final class String 
implements java.io.Serializable, Comparable<String>, CharSequence {

    private final char value[];

    private int hash; // Default to 0

    private static final long serialVersionUID = -6849794470754667710L;
}

通过源码,可以看出String类被final修饰,也就意味着String不能被继承,它其中的方法都默认被final修饰(此特性是final的特点)。也就是说当String对象创建之后,就不能再修改此对象中存储的字符串内容,就是因为如此,才说String类型是不可变的(immutable)

在我们平常创建String对象时,在底层通过char数组来实现。

截取字符串:

public String substring(int beginIndex, int endIndex) {
    if (beginIndex < 0) {
        throw new StringIndexOutOfBoundsException(beginIndex);
    }
    if (endIndex > count) {
        throw new StringIndexOutOfBoundsException(endIndex);
    }
    if (beginIndex > endIndex) {
        throw new StringIndexOutOfBoundsException(endIndex - beginIndex);
    }
    return ((beginIndex == 0) && (endIndex == count)) ? this :
        new String(offset + beginIndex, endIndex - beginIndex, value);
}

拼接两个字符串:

public String concat(String str) {
    int otherLen = str.length();
    if (otherLen == 0) {
        return this;
    }
    int len = value.length;
    char buf[] = Arrays.copyOf(value, len + otherLen);
    str.getChars(buf, len);
    return new String(buf, true);
}

替换字符串中的内容:

public String replace(char oldChar, char newChar) {
    if (oldChar != newChar) {
        int len = count;
        int i = -1;
        char[] val = value; /* avoid getfield opcode */
        int off = offset;   /* avoid getfield opcode */

        while (++i < len) {
        if (val[off + i] == oldChar) {
            break;
        }
        }
        if (i < len) {
        char buf[] = new char[len];
        for (int j = 0 ; j < i ; j++) {
            buf[j] = val[off+j];
        }
        while (i < len) {
            char c = val[off + i];
            buf[i] = (c == oldChar) ? newChar : c;
            i++;
        }
        return new String(0, len, buf);
        }
    }
    return this;
}

截取了String类中的三个常用方法,从这三个方法的返回值中可以看出,无论是substring()、concat()还是replace()方法,他们对字符串的操作都不是在原有字符串上进行的,而是通过一系列操作生成了一个新的字符串对象。

这也符合了我们上面所说的,String类被final修饰不可改变,String对象一单创建就固定不变了,对String对象的任何操作都不会改变原对象,只会新生成一个对象。

image

创建String对象

在Java程序中,创建String对象有两种形式,一种叫做字面量形式,例如:String str = "jiaboyan";一种叫做构造形式,也就是我们通常的new对象,例如:String str = new String("jiaboyan");

无论是字面量,还是构造形式,在我们编码时都经常使用,尤其是前者。但是,这两种实现方式在性能和内存上却有着不小的差别。

采用字面值的方式赋值:

public static void test1(){
    String str1 = "jiaboyan";
    String str2 = "jiaboyan";
    System.out.println("test1比较结果为:"+ (str1 == str2));//true
    //System.out.println("test1比较结果为:"+ str1 == str2);//false 注意此种写法
}

执行String str1 = "jiaboyan",程序会去字符串常量池中中查找是否存在"jiaboyan"。如果不存在,则在字符串常量池中创建"jiaboyan",并将“jiaboyan”的引用地址返回给str1,也就是说str1拿到了字符串常量池中“jiaboyan”的引用。如果存在,则不创建任何字符串,直接将池中"jiaboyan"引用地址返回赋给所属变量。当创建字符串对象str2时,字符串池中已经存在"jiaboyan",此时会直接把对象"jiaboyan"的引用地址返回给str2。

采用new关键字新建一个字符串对象:

public static void test2(){
    String str1 = new String("jiaboyan");
    String str2 = new String("jiaboyan");
    System.out.println("test2比较结果为:"+ (str1 == str2));//false
}

采用new方式创建对象,执行String str1 = new String("jiaboyan"),程序会在字符串常量池中查找有没有"jiaboyan"这个字符串,如果有,则不在字符串常量池中创建"jiaboyan",直接在堆中创建一个"jiaboyan"字符串对象,然后将堆中的这个"jiaboyan"对象的地址返回给str1;如果没有,则首先在字符串常量池中创建一个"jiaboyan"字符串,然后再在堆中创建一个"jiaboyan"字符串对象,然后将堆中的这个"jiaboyan"对象的地址返回给str2。此时,str1和str2所指向不同的堆内存区域,使用==比较返回为false。

两种创建方式比较:

public static void compare(){
    String str1 = "jiaboyan";
    String str2 = new String("jiaboyan");
    System.out.println("compare比较结果为:"+ (str1 == str2));//false
}

根据前面的2个例子,可以得出,当我们在创建str1的对象时,实际上程序会去字符串常量池中去创建“jiaboyan”,而当程序执行到str2时,会首先检查字符串常量池中是否存在,若存在则直接在堆内存中创建一个字符串对象;若不存在,则首先在字符串常量池中创建“jiaboyan”,再在堆内存中创建字符串对象。所以,当两者进行比较时,实际上内存地址是不同的。

编译期确定:

public static void test3(){
    String str1 = "jiaboyan";
    String str2 = "jiaboyan";
    String str3 = "jia"+"boyan";
    System.out.println("test3比较结果为:"+ (str1 == str2)); //true
    System.out.println("test3比较结果为:"+ (str1 == str3)); //true
}

str1和str2的原理跟第一个例子相同,不在过多陈述。在str3中,两个字符串拼接起来合成一个字符串,在编译期做了拼接处理,被解析成了一个字符串常量,所以str3在运行期间是以一个整体"jiaboyan"在进行比较,结果为true;

使用javap命令,可以查看到test3()在编译期的处理情况。或者通过查看生成的.class文件。

image

编译期无法确定:

public static void test4(){
    String str1 = "jiaboyan";
    String str2 = new String("jiaboyan");
    String str3 = "jia" + new String("boyan");
    System.out.println("test4比较结果为:"+ ( str1==str2 )); //false
    System.out.println( "test4比较结果为:"+ (str1==str3 )); //false
    System.out.println( "test4比较结果为:"+ (str2==str3 )); //false
}

str1和str2的结果,上面的例子已经说明。str1在编译器可以确定,只会在字符串常量池中创建。str2在运行期,会在堆中对象。str3在编译期无法确定内容,所以编译时候无法进行优化拼接,直到运行时才可确定,并生成新的对象在堆中。

编译期无法确定:

public static void test5(){
    String str1 = "jia";
    String str2 = "boyan";
    String str3 = str1 + str2;
    System.out.println("test5比较结果为:"+ (str3 == "jiaboyan")); //false
}

String str3 = str1 + str2在编译器无法确定,所以无法做拼接优化。只能等到真正运行时,才能确定。所以当str3 == "jiaboyan"时,结果为false,因为一个在堆中创建,一个在字符串常量池中。此外,str3虽然无法在堆中做拼接优化,但是str3在编译期还是做了代码优化,使用的是StringBuilder。具体,请看.class文件:

image

两个在编译期无法确认的String,在编译后是通过StringBuilder对象的append()进行处理的,最后在调用toString()将结果返回给str3。所以,在代码中要么就使用全字符串拼接,要不就别拼接。

编译期确定:

public static void test6(){
    final String str1 = "jia";
    final String str2 = "boyan";
    String str3 = str1 + str2;
    System.out.println("test6比较结果为:"+ (str3 == "jiaboyan"));//true
}

回顾下final的含义,当用final修饰一个类时,表明这个类不能被继承。当用final修饰一个变量时,如果是基本数据类型的变量,则其数值一旦在初始化之后便不能更改;如果是引用类型的变量,则在对其初始化之后便不能再让其指向另一个对象。

在编译期间,由于str1和str2使用了final修饰,所以编译器知道该对象不可改变,所以当编译到str3时,会进行代码优化,直接将str1和str2进行字符串拼接,形成一个“jiaboyan”字符串。当执行比较时为true.

image

编译期无法确定:

public static void test7(){
    final String str1 = "jia";
    final String str2 = get();
    String str3 = str1 + str2;
    System.out.println("test6比较结果为:"+ (str3 == "jiaboyan"));//false
}

public static String get(){
    return "boyan";
}

与上面的例子类似,两个变量str1和str2都用了final修饰。不同的是,str2的值是通过方法来获得。在编译期间,无法确定最终的值,只能在运行时确定,因此str3和“jiaboyan”指向的是不同的内存区域。str3指向了堆中的内存地址,而“jiaboyan”指向的是字符创常量池中。

编译期无法确定:

public static void test8(){
    String str1 = "bo";
    String str2 = "yan";
    String str3 = "jia" + "www" + str1 + "qqq" + "xxx" + str2;
}

与前面的例子类似,本例子算是对上面的一个总结。在我们的程序中,是直接拼接字符串,还是字符串和变量共同连接使用。

通过,编译后的class文件来看,str3中使用了StringBuild来处理字符串之间的拼接,最后在通过toString的方式来返回给str3;

在字符串变量中,使用 + 连接符进行连接时,在编译期间,连接操作会将最左侧的字符串拼接,并创建StringBuilder对象,然后依次对右边进行append操作,最后将StringBuilder对象通过toString()方法转换成String对象。当使用 + 进行多个字符串连接时,实际上是产生了一个StringBuilder对象和一个String对象。

image

equals() 和 ==

关于 == 和 equals() 的使用,也是我们面试/日常工作中经常遇到的。对于这两种比较方式,我们需要有一个清晰的理解。

对于 == 来说,如果比较的是基本类型,例如:byte,short,char,int,long,float,double,boolean,那么实际比较的就是该变量真实值是否相同。但,如果比较的是引用类型,例如:new ArrayList(),new Obeject,那么实际比较的该变量实际在内存中的地址。

对于equals()来说,equals()是基类Object中定义的方法,所有对象都默认继承该类,所以也就默认继承了equals()方法。对于默认equals()来说,实际比较的两个对象在内存中的地址是否相同。

值得注意的是,由于equals()方法可以被重写,所以当类中对equals()重写时候,需要单独关注。例如:String类中就对对equals()进行了重写,实际比较的就是两个字符串中内容是否相同,而不是真实的内存地址。

String.intern()

在String类中,有一个intern()方法,该方法的作用是将在堆中的字符串,copy一份存放到字符串常量池中,设计的初衷其实是为了节省内存的使用,提高程序的性能,可以让程序重用String。

代码如下:

public class test {

    public static void main(String[] agrs){
        Integer[] sample = new Integer[10];
        sample[0] = 0;
        sample[1] = 1;
        sample[2] = 2;
        sample[3] = 3;
        sample[4] = 4;
        sample[5] = 5;
        sample[6] = 6;
        sample[7] = 7;
        sample[8] = 8;
        sample[9] = 9;
        String[] arr = new String[10000000];
        long t = System.currentTimeMillis();
        for (int i = 0; i < 10000000; i++) {
            arr[i] = new String(String.valueOf(sample[i % sample.length])).intern();    
            //arr[i] = new String(String.valueOf(sample[i % sample.length]));
        }
        System.out.println("总耗时:" + (System.currentTimeMillis() - t) + "ms");
    }
}

测试结果:

使用intern()方法的耗时,要比不使用intern()的耗时更长;

平均来看:1800ms 5500ms

在Java1.6中,String.intern()在调用后,会将在堆中生成的字符串,copy一份到字符串常量池中,进而在常量池中生成了一个新的对象;而在Java1.7中,String.intern()有所改变,不会在常量池中新生成对象,而是将在堆中的引用复制到常量池中。

将一下代码,分别在Java1.6和Java1.7下去执行:

public class test {

    public static void main(String[] agrs){
        String str1 = new String("1111") + new String("2222");
        str1.intern();
        String str2 = "11112222";
        System.out.println(str1 == str2);
    }
}

测试结果如下:

在Java1.6:false

在Java1.7:true
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018.03.31 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Java-String那些事
    • String源码(截取)
      • 创建String对象
        • equals() 和 ==
          • String.intern()
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档