字符串留用与字符串池

1、关于字符串操作对应用程序性能的影响

字符串相等性检查是应用程序常见的操作,于此同时,这也是一种严重损害性能的操作.执行序号(字符串的二进制)相等行检查时,CLR会进行以下操作:

1、判断字符串的长度是否相等,不相等,比较结果直接返回false,如果相等,继续下一步操作

2、比较字符串的长度相等,CLR会比较每个单独的字符才能最终确定。而执行对语言文化敏感的比较时,CLR必须比较所   有单独的字符,因为字符串即使长度不同也可能相等.

2、字符串留用  一  减少复制相同字符串实例对内存的消耗

因为字符串的不可变性,如果应用程序经常对字符串进行区分大小写的序号比较,这个时候如果你知道有许多字符串会有相同的值,那么就可以利用CLR的"字符串留用"机制来提升应用程序的性能.

原理:只保存相同字符串的一个实例来提升内存的利用率。将相同的字符串变量引用都指向一个字符串对象.

3、CLR实现字符串留用的过程

CLR初始化时会创建一个内部哈希表.在这个表中,键(key)是字符串,而值(value)是对托管堆中的String对象的引用.这个过程类似与四、CLR执行程序集中代码和IL代码简介 CLR第一次执行一个方法的过程类似,它会初始化一个内部结构,生成一系列的地址,地址指向JITComliler函数,该函数会将代码转成CPU指令等操作,并返回结果给调用的C#方法.

注:该哈希表最开始是空的.

String类提供了两个方法便于你访问这个内部哈希表:

(1)、Intern方法用于获取一个String,获得它的哈希码,并在哈希表中检查是否有相匹配的,如果存在完全相同的字符串,就返回对现有String对象的应用.如果不存在全完相同的字符串,就创建字符串的副本.将副本添加到内部哈希表中,返回对该副本的引用.如果应用程序不再保持对原始String对象的引用,这时垃圾回收器就会介入,将字符串的内存强行释放掉.

注:垃圾回收器不会释放内部哈希表引用的字符串,因为哈希表正在容纳对它们的引用.除非卸载AppDomain或进程终止,否则其内部哈希表应用的String对象不能被释放.

(2)IsInterned方法也获取一个String,并在内部哈西表中查找它.如果哈西表中有匹配的字符串,IsInterned方法就返回对这个留用字符串对象的应用.但如果没有,IsInterned就返回null,不会将字符串添加到哈希表中.

4、CLR默认留用程序集元数据中的字面值字符串

程序集加载时,CLR默认留用程序集元数据中的描述的所有字面值字符串,大微软知道这个过程可能因为额外的哈希表查找而显著影响性能,所以现在可以禁用此功能.通过对程序集用System.RunTime.ComiplerServices.CompilationRelaxationsAttribute进行了标记,并指定了System.RunTime.ComiplerServices.CompilationRelaxations.NoStringIntering标志值.那么根据ECMA规范,CLR可能选择不留用指定程序集的元数据定义的所有字符串.为了提升性能,C#编译器在编译程序集是总是指定上述连个特性和标志.

5、CLR的4.5班版本及以上选择忽略4中的特性和标志,及显示留用指定字符串

由于CLR4.5及以上选择忽略4中的特性,所以程序集加载到AppDomain中时,CLR会对该程序集中元数据中所描述的所有字面值字符串.代码如下:

String str = "xiaochao";
String str1 = "xiaochao";
Console.WriteLine(ReferenceEquals(str,str1));//输出:True

注:程序集加载到AppDomian中时,CLR对程序集中的元数据中的字面值字符串进行了留用,所以导致了"xiaochao"被留用,结果str和str1引用了堆中的同一个"xiaochao"字符串,但是我们的代码不能依赖这一行为,因为未来的CLR版本可能会重视这些特性和标志,到时候将不会对程序集元数据中的字面值字符串不进行留用.下面的代码将显示留用字符串,代码如下:

//去内部哈希表中检查是否有xiaochao字符串,有的话返回该字符串的引用,反之,创建该字符串的副本,返回该副本的引用.
str = String.Intern(str);
//去内部哈希表中检查是否有xiaochao字符串,发现有xiaochao字符串,返回它的引用
str1 = String.Intern(str1);
Console.WriteLine(ReferenceEquals(str, str1));//输出:True

6、字符串池

编译源代码时,编译器必须处理每个字面值字符串,并在托管模块中的元数据中嵌入.同一个字符串在源代码中多次出现,如果每次都去内存中重复开辟空间,不仅浪费内存,而且把它们嵌入元数据会使生成的文件无谓的增大.

为了解决这个问题,许多编译器(包括C#编译器)只在模块的元数据中只将字面值字符串至写入一次,CLR默认留用程序集元数据中的字面值字符串。引用改字符串的所有代码都被修改成引用元数据中的同一个字符串.编译器将单个字符串的多个实例合并成一个实例,能显著减少模块的大小.C/C++编译器多年来一直采用这个技术,这个技术被称为"字符串池".

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Java帮帮-微信公众号-技术文章全总结

【选择题】Java基础测试九(16道)

【选择题】Java基础测试九(16道) 117.下列说法正确的有() A. class中的constructor不可省略 B. constructo...

39270
来自专栏ShaoYL

iOS循环引用

31050
来自专栏微信公众号:Java团长

Java堆和栈的区别

在函数中定义的一些基本类型的变量和对象的引用变量都是在函数的栈内存中分配。当在一段代码块中定义一个变量时,Java就在栈中为这个变量分配内存空间,当超过变量的作...

27730
来自专栏智能算法

Python学习(三)---- 集合、文件操作、字符编码和函数

https://blog.csdn.net/fgf00/article/details/52167245

11120
来自专栏前端布道

JavaScript设计模式与开发实践 - 高阶函数的应用

定义 高阶函数是指至少满足下列条件之一的函数: 函数可以作为参数被传递; 函数可以作为返回值输出。 JavaScript语言中的函数显然满足高阶函数的条件,在实...

33130
来自专栏企鹅号快讯

看完这篇文章就能当Python工程师

有句话说得好,不想做程序员的司机不是好厨师!用十分钟看完小编整理的这篇文章,分分钟钟教你做司机...不是,是厨师...哦也不是,是程序猿! 在这里我还是要介绍一...

22650
来自专栏FreeBuf

PHP代码安全杂谈

虽然PHP是世界上最好的语言,但是也有一些因为弱类型语言的安全性问题出现。WordPress历史上就出现过由于PHP本身的缺陷而造成的一些安全性问题,如CVE-...

40060
来自专栏noteless

[三]java8 函数式编程Stream 概念深入理解 Stream 运行原理 Stream设计思路

        流不是存储元素的数据结构;相反,它通过一个计算操作的管道,从一个数据源,如数据结构、数组、生成器函数或i/o通道中传递元素

45250
来自专栏Java帮帮-微信公众号-技术文章全总结

Java基础-day01-基础题

1. 简述java语言,具有哪些特性? (1).java语言是简单的 java语言是和c++语言类似的,其次java中丢弃了c++中一些难理解的特性,比如运算符...

29540
来自专栏進无尽的文章

编码篇-iOS程序中的内存分配 栈区堆区全局区等相关知识

在计算机的系统中,运行的应用程序中的数据都是保存在内存中,不同类型的数据,保存的内存区域不同。内存区域大致可以分为:栈区、堆区、全局区(静态区)、文字常量区、程...

24220

扫码关注云+社区

领取腾讯云代金券