专栏首页写PHP的老王最简单的php trim函数并不简单

最简单的php trim函数并不简单

字符串的处理在任何程序中应该是最最常见的了吧。php 的trim函数就是用来去除字符串的字符串。最常用的就是去除空格了。但是,这个简单的函数,是否真的像你认为的那样简单呢?

trim函数的定义如下:

trim是两边去除,还有ltrim 从左边去除,rtrim从右边去除,在php源码中,最终都是通过一个函数处理的。所以一下关于trim是对php 内部统一的trim而言。

源码在ext/standard/string.c中php_trim函数中。

trim函数处理逻辑:

1、判断是否设置去除内容what,没设置则去除默认字符串

2、判断去除内容的长度,分为1个字符,多个字符去除

3、使用model分别与1,2按位与运算,确定是否进行左右去除

去除一个字符的情况:

对于左边去除,遍历字符串的每个字符,把第一个与what不相等的字符的位置作为新字符串的起始位置,同时更新长度

对右边去除,从右边开始遍历,找到第一个不等于what的字符,把字符串长度减去遍历次数。

到这里,新字符串起始位置有了,长度也确定了,然后执行字符串赋复制命令,返回去除之后的字符串

去除多个字符串的情况:

首先使用一个mask数据,用于标记那些需要去除的字符串(mask 可以理解为一个以字符ascii值为键值的hash表)。 然后执行操作跟去除一个字符类似,只是结束条件是寻找到第一个不在字符表里的元素。

默认情况:

处理方式跟之前一样,只是去除内容限制在ascii码小于32(即空格)的字符。且只去除'\r','\t','\v','\0','\n'字符

看到这里,我们所了解到的有一下几点:

1、trim 默认去除'\r','\t','\v','\0','\n'

2、trim 给定单个字符是一个循环操作,循环结束条件是第一个不相等的字符

3、trim 多个字符去除,是循环去除,直到遇到第一个不在列表中的字符。

在来看php_charmask这个函数

中间省略部分可以不看,只是对非法数据的一个错误返回。

只要看第一个if的内容。如果字符串假设传入内容what='a..f'。input指针指向a,这个时候满足if条件,在里面执行的操作相当于把a,b,c,d,e,f内容添加到mask中去。所以所trim是可以指定去除区间的trim('abcdefg','a..f')返回内容只剩下g。

下面几个实际的输出更容易理解:

1、trim('abcdf' , 'fd'); 输出abc,trim不是按顺序的,只要在列表内,统统去掉

2、trim('abccdffff' , 'f'); 输出abccd, trim会把所有满足条件的去掉

3、trim('abcdffff' , 'a..d'); 输出内容ffff, trim可以指定区间,但是如果你真的想要去除'a..d',就不能用trim了

trim去除列表的性质,在多字节处理的时候就会出现问题了,这也就是为什么trim对于中文会产生乱码。

trim('品、' , '、'),'品' utf字符十六进制表示为'e5 93 81', 字符串'、'的十六进制表示'e3 80 81'。在trim中,按字节计算,utf8中文编码3个字节表示一个汉字。因此相当于trim去掉内容是三个字符。这三个字符的十六进制表示为'e3 80 81'。所以最终返回字符串的十六进制表示为'e5 93',因为81已经被去除了。

trim('的、', '、') 就能返回正确结果。因为'的'的十六进制表示'e7 9a 84'。

所以trim并不简单。要时刻记着,trim是去除列表内的所有字符,遇到第一个非列表字符停止!!

本文分享自微信公众号 - 写PHP的老王(laowang_php),作者:写PHP的老王

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-01-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Yii2 VS thinkphp5.0

    Yii2.0使用一年多了,最近因为原来公司狗带了,换了公司,开始使用tp5.0。之前也有使用过tp3.2的框架,但是每次问及各个框架之前的区别的时候,总是不觉得...

    写PHP的老王
  • 如果让 strpos 查找一个整数类型的数字会发生什么?

    每次数据来了,想要查找这个字符串中某个字符,上来就是使用strpos。strpos用于查找字符串中某个子串第一次出现的位置。

    写PHP的老王
  • ES能为你解决什么问题,又会带来什么问题?

    S主要运用于全文搜索、数据分析, 底层使用开源库Lucene,拥有丰富的REST API。内部分布式的数据存储、倒排索引等设计,使其可以快速存储、搜索、分析海量...

    写PHP的老王
  • 迁移学习全面指南:概念、应用、优势、挑战

    【编者按】Springboard AI顾问、前Intel数据科学家Dipanjan (DJ) Sarkar全面介绍了迁移学习的概念、应用、优势、挑战,重点关注深...

    zenRRan
  • golang mgo的mongo连接池设置:必须手动加上maxPoolSize

    本司礼物系统使用了golang的 mongo库 mgo,中间踩了一些坑,总结下避免大家再踩坑 golang的mgo库说明里是说明了开启连接复用的,但观察实验发现...

    财主刀刀
  • 深度学习和拓扑数据分析的六大惊人之举

    用户1737318
  • 胶囊网络为何如此热门?与卷积神经网络相比谁能更甚一筹?

    编译 | AI科技大本营 参与 | 孙士洁 编辑 | 明 明 【AI科技大本营按】胶囊网络是什么?胶囊网络怎么能克服卷积神经网络的缺点和不足?机器学习顾...

    AI科技大本营
  • 深度学习和拓扑数据分析的六大惊人之举

    假如你有一个一千列和一百万行的数据集。无论你从哪个角度看它——小型,中型或大型的数据——你不可能看到它的全貌。将它放大或缩小。使它能够在一个屏幕里显示完全。由于...

    CSDN技术头条
  • 小谈python里 列表 的几种常用用法

    在python中列表的常用方法主要包括增加,删除,查看和修改。下面以举例子的方法具体说明,首先我们创建两个列表,列表是用[ ]表示的,里面的元素用逗号隔开。

    py3study
  • ​21个必须知道的机器学习开源工具

    我喜欢机器学习开源社区,作为一个有抱负且资深的数据科学家,我的大部分学习来自开源的资源和工具。

    用户1737318

扫码关注云+社区

领取腾讯云代金券