[table id=1 /]
re.match尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回None
示例
import re
content = 'Hello asdasd 123124 aaaaa python'
result = re.match('^Hello.*\d+.*python$',content)
print(result)
结果
<re.Match object; span=(0, 32), match='Hello asdasd 123124 aaaaa python'>
import re
content = 'Hello asdasd 123124 aaaaa python'
result = re.match('^Hello.*(\d+).*python$',content)
print(result.group(1)) #result.group(n)为匹配的目标
简单理解就是能匹配多少就匹配多少,就像上例中的匹配方式,匹配结果为4
非贪婪匹配很常用,往往能得到我想要的结果,写法如下
仔细看没啥区别,只是在目标匹配的内容外加了一个?,这样即表示非贪婪匹配
当匹配的内容里出现换行时该如何匹配呢?
加一个参数,re.S即可
如果使用正则匹配,尽量使用泛匹配,非贪婪模式,有换行则使用re.S
re.search
除了rs.match方法,还有re.search,使用re.search时便非常方便了,因为它是扫描整个字符串并返回第一个成功的匹配,比如我们查找一些关键字,该关键字并没有在行首,可能在中间位置,此时在使用re.match时便匹配不到了。
可以看到使用re.match是匹配不到的,换re.search试试
所以:能尽量使用re.search就不要使用re.match
re.findall
搜索字符串,以列表形式返回全部能匹配的子串
先简单介绍这么多