今天我们学习的内容是正则表达式!
一、正则表达式的概念
正则表达式 regular expression)是用来进行较复杂文本处理,特别是复杂的查找或替换处理的计算机语言。...我们在进行计算机编程或者文本处理时,通常需要进行一些文本的查找、替换。如果查找或替换的工作比较复杂,就需要借助正则表达式来完成。...又如,我们需要对文本进行清洁处理(如一次删除所有词性赋码)或者提取文本的特定信息时,往往也需要使用正则表达式。因此,正则表达式在语料库语言学或计算语言学研究中使用非常广泛。...如果我们需要搜索某个字符或字符串(单词),如字符i或者字符串in,则只需在文本阅读器的查找中输入in,即可查找到。...'\d'd可以匹配上述文本中的任意一个数字。
'is'既可以匹配上述文本中His中的is,也可以匹配is单词。
'\bis'只能匹配上述文本中的is单词,不能匹配His中的is。