首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >基于MOOC嵩天《Python网络爬虫与信息提取》视频学习记录——第三周:正则表达式

基于MOOC嵩天《Python网络爬虫与信息提取》视频学习记录——第三周:正则表达式

作者头像
Dragon水魅
发布2026-01-23 14:21:31
发布2026-01-23 14:21:31
980
举报

1.正则表达式的语法

正则表达式的常用操作符

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

正则表达式语法实例

在这里插入图片描述
在这里插入图片描述

经典正则表达式实例

在这里插入图片描述
在这里插入图片描述
匹配ip地址的正则表达式
在这里插入图片描述
在这里插入图片描述

2.re库的基本使用

正则表达式的表示类型

在这里插入图片描述
在这里插入图片描述

re库主要功能函数

在这里插入图片描述
在这里插入图片描述
1)re.search( )
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
代码语言:javascript
复制
import re
match = re.search(r'[1-9]\d{5}','BIT 100081')
if match:
    print(match.group(0))
在这里插入图片描述
在这里插入图片描述
2)re.match( )
在这里插入图片描述
在这里插入图片描述
3)re.findall( )
在这里插入图片描述
在这里插入图片描述
代码语言:javascript
复制
import re
ls = re.findall(r'[1-9]\d{5}','BIT100081 TSU100084')
print(ls)
在这里插入图片描述
在这里插入图片描述
4)re.split( )
在这里插入图片描述
在这里插入图片描述
代码语言:javascript
复制
import re
ls1 = re.split(r'[1-9]\d{5}','BIT100081 TSU100084')
print(ls1)
ls2 = re.split(r'[1-9]\d{5}','BIT100081 TSU100084',maxsplit = 1)
print(ls2)
在这里插入图片描述
在这里插入图片描述
5)re.finditer( )
在这里插入图片描述
在这里插入图片描述
代码语言:javascript
复制
import re
for i in re.finditer(r'[1-9]\d{5}','BIT100081 TSU100084'):
	if i:
		print(i.group(0))
在这里插入图片描述
在这里插入图片描述
6)re.sub( )
在这里插入图片描述
在这里插入图片描述
代码语言:javascript
复制
import re
print(re.sub(r'[1-9]\d{5}','zipcode','BIT100081 TSU100084'))
在这里插入图片描述
在这里插入图片描述

注:在使用sub的替换时,无法替换掉“\n”换行符,需先将“\n”替换为空或者空格,再进行替换

re.compile( )

在这里插入图片描述
在这里插入图片描述

re库的另一种等价用法

在这里插入图片描述
在这里插入图片描述

3.re库的match对象

match对象的属性

在这里插入图片描述
在这里插入图片描述

match对象的常用方法

在这里插入图片描述
在这里插入图片描述
代码语言:javascript
复制
import re
m = re.search(r'[1-9]\d{5}','BIT100081 TSU100084')
print(m.string)
print(m.re)
print(m.pos)
print(m.endpos)
print(m.group(0))
print(m.start())
print(m.end())
print(m.span())
在这里插入图片描述
在这里插入图片描述

4.re库的贪婪匹配和最小匹配

Re库默认采用贪婪匹配,即输出匹配最长的子串。

代码语言:javascript
复制
import re
match = re. search(r'PY.*N','PYANBNCNDN')
print(match.group(0))
在这里插入图片描述
在这里插入图片描述

当我们需要re库的最小匹配时,只需进行如下修改:

代码语言:javascript
复制
import re
match = re. search(r'PY.*?N','PYANBNCNDN')
print(match.group(0))
在这里插入图片描述
在这里插入图片描述

最小匹配操作符

在这里插入图片描述
在这里插入图片描述
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2026-01-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.正则表达式的语法
    • 正则表达式的常用操作符
    • 正则表达式语法实例
    • 经典正则表达式实例
      • 匹配ip地址的正则表达式
  • 2.re库的基本使用
    • 正则表达式的表示类型
    • re库主要功能函数
      • 1)re.search( )
      • 2)re.match( )
      • 3)re.findall( )
      • 4)re.split( )
      • 5)re.finditer( )
      • 6)re.sub( )
    • re.compile( )
    • re库的另一种等价用法
  • 3.re库的match对象
    • match对象的属性
    • match对象的常用方法
  • 4.re库的贪婪匹配和最小匹配
    • 最小匹配操作符
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档