编程小短文:Bash子字符串还在用=?试试=~,性能瞬间飙升100倍!

引言

Bash 是 Linux 系统下钦定的 shell。你可以通过

cat /etc/shells

查看当前系统支持的 shell 种类。

Bash 不但是系统管理员与内核交互的利器,且是一种语言,可以编写大多数系统的自动化脚本,用于简化运维工作。

今天我们学习一个知识点:如何在 Bash 中判断某个字符串中,是否包含子字符串?

题外话

在高级编程语言中,一般都提供了该功能,比如 PHP 使用函数 strpos 查找子字符串首次出现的位置,有则返回 integer 整型,没有则返回 false。

strpos ( string $haystack , mixed $needle [, int $offset = 0 ] ) : int

在 MySQL 中也经常使用字符串匹配,比如通配符 %,还可以使用函数 instr 来实现。

SELECT INSTR("abcd",'f');

问题的提出

一位开发者在编写 Bash 脚本的过程中,遇到一个问题。首先是有这样一个赋值操作:

string="My string"

然后他判断是否存在某个子字符串:

if [ $string ?? 'foo' ]; then

echo "It's there!"

fi

他这里打的 ?? 是占位符号,不知道该怎么写。甚至有了一种丑陋的写法:

if echo "$string" | grep 'foo'; then

echo "It's there!"

fi

这样的实现是不是 low 太多了?

解决方法

能用一行解决的问题,何必 BB!

一位开发者给出的方案是,如果判断条件上使用了双中括号,那么就可以这样写:

string='My long string'

if [[ $string == *"My long"* ]]; then

echo "It's there!"

fi

注意,是将子字符串外部使用双*号包裹。

其中 == 是字符串相等的比较符。而 * 则是通配符,会适配任意长度的任意字符。

强大的正则

我们知道,Bash 中的数据类型是极为弱的,不像高级语言那样区分 integer, string, float, double, array, Object 等等。在 Bash 看来,万物都是字符串。这与 Unix 的“一切皆文件”哲学不谋而合。

处理字符串,我们必然绕不开“正则表达式”。

上述的问题,有没有可能使用强大的正则方式处理呢?答案是肯定的。

比如这样写:

string='My string';

if [[ $string =~ "My" ]]

then

echo "It's there!"

fi

注意我们使用了 =~ 用于正则匹配,而不是逻辑运算符了。

正如上面所述,Bash 中如果使数字的比较,也完全可以使用字符串的正则方式处理。

比如要判断某个整数值,是否在某个有效的列表内。可以这样写。

number=3

if [[ "1,3,5,6,9" =~ "${number}" ]]; then

echo "Yes"

fi

用起来是不是精简多了。

知识延伸

像问题中使用 grep 用于子字符串筛选的那样,其实有更稳固的写法:

if grep -q foo

echo "It's there"

fi

一般不使用 echo 后使用管道符 grep。

写在最后

在命令行中敲一下测试测试吧。只有多实践才能加深印象。

另外,正则表达式是真的强!

Happy coding :_)

我是 @程序员小助手 ,持续分享编程知识,欢迎关注。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200525A0OQNV00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券