前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >细微之处见真章之StringUtils的isBlank函数细节解读

细微之处见真章之StringUtils的isBlank函数细节解读

作者头像
明明如月学长
发布2021-08-31 11:18:14
7020
发布2021-08-31 11:18:14
举报
文章被收录于专栏:明明如月的技术专栏

一、背景

技术群里有一个老铁分享了一段 commons-lang 的 StringUtils 工具类的代码:

代码语言:javascript
复制
public static boolean isBlank(final CharSequence cs) {
    int strLen;
    if (cs == null || (strLen = cs.length()) == 0) {
        return true;
    }
    for (int i = 0; i < strLen; i++) {
        if (Character.isWhitespace(cs.charAt(i)) == false) {
            return false;
        }
    }
    return true;
}

得出的结论是:

老外的代码风格和咱们真的不一样,人家判断某个布尔值是否等于 false,居然这么写,咱们都是取反判断的。

真的是这样吗?

从这段代码中我们还发现,人家的参数用 final 修饰.

What are you 弄啥哩?

平凡之处见真章,本文将以这个简单的问题入手,带着大家熟悉反编译和反汇编,带着大家分析问题。

二、布尔判断问题

2.1 真的是老外都这么写?

2.1.1 拉最新版本

那么真的老外都是这么写的吗?我们拉取 commons-lang 最新版的代码,发现并非如此。

master 分支 commitId 为 fe44a99852719ff842ff5 的源码:

代码语言:javascript
复制
public static boolean isBlank(final CharSequence cs) {
    int strLen = length(cs);
    if (strLen == 0) {
        return true;
    }
    for (int i = 0; i < strLen; i++) {
        if (!Character.isWhitespace(cs.charAt(i))) {
            return false;
        }
    }
    return true;
}

已经改成取反的方式了。

那么问题来了,大家可以想想,为啥改了呢?

很显然,源码改成这种写法应该是这种写法更好,否则没必要改啊,对吧。

那么为啥这种写法更好呢?

我们可以借助 IDEA 的检查工具。

其实如果平时你写代码的时候能够关注 IDEA 的警告,就会发现 “条件 == false” 这种写法会给出下面警告:

因此我们可知道, IDEA 不推荐这种写法,认为另外一种写法是更简化的形式。

那么我们如何知道作者的用意呢?

直接拉源码,查看该函数或者该类的修改历史即可。

可以从修改历史的提交注释中找到原因。

可以看出修改原因为, 根据 IDEA 提示进行重构,在 #276 编号的 PR 中引入进来的。

我们可以到该项目的 pull requests 中修饰该编号:

https://github.com/apache/commons-lang/pull/276

这里有修改的详细描述。

另外我们在研究这个问题的时候又有了新的发现:

我们发现 overlay 函数在此次提交时,将 StringBuilder 拼接的字符串的方式改为了直接用加号拼接,大家可以思考下为什么。可以评论区给出自己的看法。

2.1.2 看其他项目

我们还可以用专栏里强力推荐的 codota 查看其他外国的知名开源项目有没有这种写法。

发现有很多类似的写法,包括 spring-framework:

2.2 研究两者的差别

为了更好地研究这个问题,咱们自己写一个字符串工具类,Copy一下代码:

代码语言:javascript
复制
public class StringUtils {

    public static boolean isBlank(final CharSequence cs) {
        int strLen;
        if (cs == null || (strLen = cs.length()) == 0) {
            return true;
        }
        for (int i = 0; i < strLen; i++) {
            if (Character.isWhitespace(cs.charAt(i)) == false) {
                return false;
            }
        }
        return true;
    }
}

对该类进行编译,然后通过 IDEA 自带的反编译工具进行反编译,得到下面的代码:

代码语言:javascript
复制
public class StringUtils {
    public StringUtils() {
    }

    public static boolean isBlank(final CharSequence cs) {
        int strLen;
        if (cs != null && (strLen = cs.length()) != 0) {
            for(int i = 0; i < strLen; ++i) {
                if (!Character.isWhitespace(cs.charAt(i))) {
                    return false;
                }
            }

            return true;
        } else {
            return true;
        }
    }
}

我们看到反编译后的代码,还是对 Character.isWhitespace 的判断取反。

我们可以查反汇编代码:

代码语言:javascript
复制
public class com.chujianyun.libs.commons.lang3.StringUtils {
  public com.chujianyun.libs.commons.lang3.StringUtils();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."":()V
       4: return

  public static boolean isBlank(java.lang.CharSequence);
    Code:
       0: aload_0
       1: ifnull        15
       4: aload_0
       5: invokeinterface #2,  1            // InterfaceMethod java/lang/CharSequence.length:()I
      10: dup
      11: istore_1
      12: ifne          17
      15: iconst_1
      16: ireturn
      17: iconst_0
      18: istore_2
      19: iload_2
      20: iload_1
      21: if_icmpge     45
      24: aload_0
      25: iload_2
      26: invokeinterface #3,  2            // InterfaceMethod java/lang/CharSequence.charAt:(I)C
      31: invokestatic  #4                  // Method java/lang/Character.isWhitespace:(C)Z
      34: ifne          39
      37: iconst_0
      38: ireturn
      39: iinc          2, 1
      42: goto          19
      45: iconst_1
      46: ireturn
}

我们可以看到 isBlank 反编译的代码的 31 行处,调用 java.lang.Character#isWhitespace(char) 返回了 boolean 值。

代码语言:javascript
复制
 31: invokestatic  #4                  // Method java/lang/Character.isWhitespace:(C)Z

JVMS 2.3.4 节对 boolean 类型有如下描述:

JVM 中用 1 表示 true , 0 表示 false。 Java 编程语言中 boolean 类型的值会被编译器编译成 JVM 所需的整数类型。

因此面执行的结果为 0 或者 1 。

然后执行 ifne

代码语言:javascript
复制
  34: ifne          39

ifne success if and only if value ≠ 0 只有值不等于 0 则为成功

如果值为 1 则跳转到 39 行,将局部变量表索引为 2 的变量即 i 加一,然后和 strLen 比较,然后…

如果值为 0 即上述结果为 false ,则执行

代码语言:javascript
复制
iconst_0  // 将常量 0 压如操作数栈
ireturn  // 将栈顶元素作为返回弹出

即等价于 return false。

然后我们将代码改成另外一种形式:

代码语言:javascript
复制
public class StringUtils {

    public static boolean isBlank(final CharSequence cs) {
        int strLen;
        if (cs == null || (strLen = cs.length()) == 0) {
            return true;
        }
        for (int i = 0; i < strLen; i++) {
            if (!Character.isWhitespace(cs.charAt(i)) ) {// 这里不同
                return false;
            }
        }
        return true;
    }
}

发现编译后的反编译代码相同,反汇编后的代码也相同(此处就不再重复贴出代码了)。

因此可以得出一个结论,两种写法编译后的字节码相同。

都是通过 ifne 判断上面表达式的boolean 结果来决定执行再次循环或者返回的逻辑。

三、final 参数问题

参数声明为 final 的目的是啥呢?

JLS 4.12.4 final variables 讲到:

变量可以声明为 final。 final 变量只能被赋值一次。 一个 final 变量,除非之前该变量是明确未被赋值,否则再次赋值会报编译时错误。 一旦 final 变量被赋值,那么它就是始终保持同一个值。 如果 final 类型的变量持有一个对象的引用,对象的状态可以由对象提供的函数修改,但是变量总是引用相同的对象。 这个原则同样适用于数组,因为数组包含多个对象;如果一个 final 变量持有数组对象,数组的元素可以修改,但这个变量引用同一个数组对象。

也有一些变量虽然不声明为 final ,也会被认为 effectively final(和 final 等效)。

局部变量声明时即初始化,如果满足以下几种情况,则为 effectively final

  • 没有声明为 final。
  • 它永远不会出现在赋值表达式的左侧。 (注意:局部变量声明符包含初始化但不能是赋值表达式。)
  • 它永远不会作为前缀或后缀递增或递减运算符的操作数出现。

2 局部变量声明时如果没有初始化,如果满足以下几种情况,则为 effectively final

  • 没有声明为 final
  • 当它出现在赋值表达式的左边时,它肯定是未赋值的,而且在赋值之前也没有明确赋值; 也就是说,它绝对是未赋值的,也不是绝对赋值在赋值表达式的右边(§16(明确赋值))。
  • 它永远不会作为前缀或后缀递增或递减运算符的操作数出现。

3 方法、构造器、lambda 或异常的参数被视作有初始化器的局部变量,目的是为了判断这些参数是否为 effectively final 的。

另外Java 语言手册还有这样一段描述:

如果变量是 effectively final ,那么为其添加 final 修饰符不会有任何错误。一个合法的 final 局部变量或者参数删除 final 修饰符,会变成 effectively final。

有了这些知识储备之后,我们再看这个问题就简单多了。

因为 lambda 表达式和匿名内部类中使用的变量要求是 final 或 effectively final类型。

从语言角度

只要满足以上条件,参数上可以不显式声明 final, 也可以在 lambda 表达式或者匿名内部类中使用。

显式声明还有一个好处是,在函数内部引用不能发生改变。

从功能角度

从功能角度来讲, isBlank 函数是判断该字符序列是否为空字符串、null 或者包含空格。

因此参数传入后不希望也不需要在函数内部对引用进行修改。

因此显式加上 final 声明更稳妥。

so ,问题解决了??

No, 上面讲到如果final 变量持有对象的引用,如果不允许修改对象的属性怎么办

可以使用不可变对象。如 String。

那么不可变对象是如何实现的呢?

我们以 String 为例:

代码语言:javascript
复制
public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
  
    /** The value is used for character storage. */
    private final char value[];
 
  
  // 将参数字符串追加到当前字符串后
    public String concat(String str) {
        int otherLen = str.length();
        if (otherLen == 0) {
            return this;
        }
        int len = value.length;
        char buf[] = Arrays.copyOf(value, len + otherLen);
        str.getChars(buf, len);
        return new String(buf, true);
    }
  
  // 其他属性和函数略
}

建议大家自行思考 String 是如何实现不可变的,这个面试中也可能会问到。

  • 存储字符数组的 value 成员变量用 final 修饰,赋值后引用不能改变。
  • 所有修改对象的属性或状态的方法返回的都是新的字符串对象。

因此我们编写不可变对象时可以参考这种思路。

那么如果引用不可变也不允许改变对象的属性怎么办?

此时可以 final + 不可变对象一起起作用。

代码语言:javascript
复制
public class MapTest {
    private static final Map<String, Integer> MAP;

    static {
        Map<String, Integer> data = new HashMap<>();
        data.put("a", 1);
        data.put("b", 2);
        MAP = MapUtils.unmodifiableMap(data);
    }

    @Test
    public void test2() {
       // 报错 java.lang.UnsupportedOperationException
        MAP.put("c", 3);
        System.out.println(MAP);
    }
}

这样,引用不可变,map 的值也不可修改。

四、启示

本文内容并不难,但是希望通过本问向大家传达一些理念。

实践是检验真理的标准。没实践不要轻易下结论。我们在下结论之前进行对比,进行调研,不要看到孤立的例子就立马下结论。

学习时要多动手。大家学习技术时要尽量自己写简单的DEMO 验证自己的想法,可以调试细节。

善用工具。 本文用到的 codota 是编程利器,还有很多超好用的插件在本的博客中或专栏里有专门的推荐。 IDEA 的语法警告、错误提示是我们养成好的编程习惯,避免犯错的极佳助手。 GIT 也是我们学习源码的重要工具。

更多以好用的 IDEA 插件和好用的效率工具可以看这篇文章

善用反编译和反汇编。通过反编译可以破解一些语法糖,通过反汇编可以从字节码层面学习知识。可以透过源码看到更本质的东西,推荐大家去重点掌握。

细微之处见真章。有些看似简单的问题背后隐藏着很多可学的知识,然而很多人会忽略这些问题。面试中一些简单问题,能否回答的全面,回答的有深度,都是一个人专业是否扎实的表现。

看源码。看源码有很多思维和方法。比如以设计者的角度学习源码;比如通过设计模式的角度学源码;比如通过调试学源码等等,专栏有专门章节详细介绍。在这里提醒大家的是,看源码一定要多思考。

思考它为什么这么写,不这么写行不行?这点很重要,比如本文提到的 为啥源码某个版本 if 条件 用 == false 判断,为啥参数带 final 等等。可以将知识串起来,加深对知识的理解。

Java 语言规范 和 Java 虚拟机规范是最权威的参考。很多人习惯看博客来学习知识。在这里我更希望大家转向从 Java 的语言和虚拟机层面来学习知识,而《Java 语言规范》和 《Java 虚拟机规范》则是官方出的权威参考。

是什么?为什么?怎么做? 这是一个非常重要的思维方式。然而很多人喜欢记忆结论。导致记住容易遗忘,记住不会用。

五、写在最后

发现很多人学习技术总是喜欢强调努力,强调多看书,多看源码。

就我个人而言,更喜欢大家如果自己的学习效果不是特别满意,多去学习和运用一些新的思维和方法。

因为新的思维和方法对技术的提升速度影响更大。

多看书也没错,但是看什么书?怎么看?多看源码也没错,看哪些源码?怎么看?有哪些思维和方法?

这些才是问题的关键,使用不同的方法看不同的内容,最后效果的差距也非常大。

总之希望大家学习时不要忽略基础,希望大家多探索一些好的方法,能够从更深的层面去学习和理解源码。


如果你觉得本文对你有帮助,欢迎点赞、转发、评论,你的支持是我创作的最大动力。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/12/28 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、背景
  • 二、布尔判断问题
    • 2.1 真的是老外都这么写?
      • 2.1.1 拉最新版本
      • 2.1.2 看其他项目
    • 2.2 研究两者的差别
    • 三、final 参数问题
    • 四、启示
    • 五、写在最后
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档