又如,我们需要对文本进行清洁处理(如一次删除所有词性赋码)或者提取文本的特定信息时,往往也需要使用正则表达式。因此,正则表达式在语料库语言学或计算语言学研究中使用非常广泛。...但如果我们需要进行更复杂的搜索,如搜索出所有带字符i或者字符串in的单词,或者需要搜索所有以ing或ed结尾的单词时,一般搜索则无能为力就需要使用正则表达式来实现。...re.findall()检索某个字符串,与re.search()不同的是,它返回一个列表,列表中包含与表达式匹配的所有结果。...可以匹配上述文本中的任意一个字母、数字、空白和行末的句点。
'\w'可以匹配上述文本中的任意一个字母和数字,但不能匹配空白和行末的句点。
'\s'可以匹配上述文本中的任意一个空白。...'\d'd可以匹配上述文本中的任意一个数字。
'is'既可以匹配上述文本中His中的is,也可以匹配is单词。
'\bis'只能匹配上述文本中的is单词,不能匹配His中的is。