正则表达式用于多种编程语言,这里使用Linux中的grep程序示例。
下面这三个表用作参考:
表 1 正则表达式中的元字符
匹配任意单个字符(除换行符)表 2 正则表达式中的重复运算符
匹配0次或者多次表 3 正则表达式中的预定义字符类(Linux)
小写字母在正则表达式中,.匹配除换行符外的任意单个字符,下面的命令从文件water.txt中匹配一个字符串,这个字符串以wa开头,之后是两个任意字符(除换行符),最后是r:
$ cat water.txt | grep 'wa..r'它可能匹配到water、waXEr、waslr等等这样的字符串。
[list]表示匹配list中的任意单个字符,比如[wW]ater匹配water和Water字符串:
$ cat water.txt | grep '[wW]ater'也可以使用表 3中的预定义字符类表示一个范围,比如[[:lower:]]at匹配以任意小写字母开头的,之后是at的字符串:
$ cat water.txt | grep '[[:lower:]]at'[4-6]这样的字符类表示匹配数字4至数字6之间的任意单个字符。
now可以匹配单词now、know和其他包含now的字符串。
如果想要匹配单词know,那么需要使用\<表示单词的开头,\>表示单词的结尾,就像下面这样:
$ cat water.txt | grep '\<[kK]now\>'这条命令匹配单词know和Know。
使用^表示行的开头,$表示行的结尾,下面的命令匹配以Water开头的行:
$ cat water.txt | grep '^Water'最后,介绍一下重复运算符。
如果想要匹配这样一个字符串,它以w开头,之后是任意的字符(除换行符)重复任意多次,这怎么表示呢?这时就需要使用重复运算符*了,它表示匹配0次或者任意多次,其他的重复运算符请查看表 2.
匹配这样的字符串需使用下面的命令:
$ cat water.txt | grep 'w.*'