前言
re是python的一个正则匹配库,可以使用正则表达式匹配出我们想要的内容
findall 使用
findall 看下源码介绍, 返回字符串中所有不重叠匹配项的列表。...比如aab,abb,acb,adb都符合
.就是匹配除 \n (换行符)以外的任意一个字符
import re
a = "abcaabffabbcdaccbfabbbgggaaabbbkk"
# .就是匹配除...*前面为开始到后面为结束的所有内容
res1 = re.findall(r"a....b", a)
print(res1)
# ['ab', 'aab', 'ab', 'accb', 'ab', 'aaab']
()的使用
比如我要从下面这段文本中取出我的博客地址, 上面学到的.*?....就是匹配除 \n (换行符)以外的任意一个字符,这里是不包含换行的
import re
a = '''作者-上海悠悠 QQ交流群:717225969 blog地址:https:
//www.cnblogs.com