前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Java 9 缩小字符串( Compact String)

Java 9 缩小字符串( Compact String)

原创
作者头像
HoneyMoose
发布2022-07-13 22:40:01
3490
发布2022-07-13 22:40:01
举报
文章被收录于专栏:CWIKIUSCWIKIUS

从 Java 9 开始,JDK 开始引入了一个叫做 缩小字符串( Compact String)。

1_kVNSX0h8p6Z3EWQzwmPjHg
1_kVNSX0h8p6Z3EWQzwmPjHg

在中文语境下,压缩和缩小都是削减的意思,很多时候是可以通用的,但是实际上还是有区别的。

JDK 9 的处理方式是不改变字符串存储使用的 char[] 数组,而是根据字符集来进行处理。

当 String 在创建的时候,如果我们知道这个字符集使用的 LATIN-1 来表示的话,我们就使用一个字节来存储。

如果是中文,或者我们知道不能用 1 个字节来存储的话,我们还是使用 2 个字节来存储,与原来的存储方式保持一致。

换句话说就是尝试用 1 个字节来存储我们可以存储的自己,而不再浪费存储空间。

现在我们需要知道的问题就是,针对 String 的操作是不是会因为这种存储格式的改变而有影响呢,因为我们在数组中存储了 2 个字符集, LATIN-1 和 UTF-16 字符集之间的混合操作是不是会受到改变?

本文章的后续部分就对这种情况进行一些说明和演示,来让我们大致了解这个改进对我们的影响。

针对日常使用 Java 的开发人员来说,这个改变是感觉不到的,至于你使用的比较等操作还是会按照正常的处理方式来处理,对你来说这个是透明的。

Java 9 中的字符串实现

直到现在,我们应该非常明确的了解到 Java 中存储 String 是使用 char[] 来处理的,这个是没有改变的。

首先,我们先定义一个 char[] 数组

代码语言:javascript
复制
private final char[] value;

然后我们再定义一个 byte[] 数组:

代码语言:javascript
复制
private final byte[] value;

定义一个 coder 变量:

代码语言:javascript
复制
private final byte coder;

这个 Code 的变量可以为下面 2 个值:

代码语言:javascript
复制
static final byte LATIN1 = 0;
static final byte UTF16 = 1;

大部分情况下,Stgring 将会对 Coder 进行判断,然后根据值使用不同的实现:

代码语言:javascript
复制
public int indexOf(int ch, int fromIndex) {
    return isLatin1() 
      ? StringLatin1.indexOf(value, ch, fromIndex) 
      : StringUTF16.indexOf(value, ch, fromIndex);
}  

private boolean isLatin1() {
    return COMPACT_STRINGS && coder == LATIN1;
}

CompactString 在 JVM 中是默认启用的,如果你不想启用,你可以使用下面的参数告诉 JVM 不使用 String 压缩功能:

代码语言:javascript
复制
+XX:-CompactStrings

coder 是如何工作的

在 Java 9 的 String 类实现中,有关字符串的长度是下面的方法来进行计算的:

代码语言:javascript
复制
public int length() {
    return value.length >> coder;
}

如果 String 只含有 LATIN-1 字符的话, coder 的值为 0,那么获得 String 字符串长度的方法就直接返回字节数组的的长度,因为你这个数组的长度就是一个自己一个元素。

在另外的一种情况,如果 Stirng 使用了 UTF-16 字符集的话,coder 的值为 1 Java 将会使用数组中存储的元素的字节实际长度来返回,这是因为数组中存储的字符可能是 2 字节的。

需要注意的是,这个修改是针对 String 的内部修改,针对绝大部分开发者来说,所有有关 String 的处理方法都是透明的。

如果你想了解更多 String 有关的内部实现,这个是你值得深入的地方。

https://www.ossez.com/t/java-9-string/14024

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Java 9 中的字符串实现
  • coder 是如何工作的
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档