前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >正则表达式基本使用方法

正则表达式基本使用方法

作者头像
你像时光唯美i
发布2022-08-26 14:10:54
4790
发布2022-08-26 14:10:54
举报
文章被收录于专栏:python开发教程
  1. 概念 正则表达式是对字符串操作的一种逻辑公式,可以用来提取特定的字符。比如可以提取邮箱,汉字,数字,大小写字母,联系方式等特定的数据。经常被用于Python,Java等编程语言中,可以批量处理通过python爬虫获得的数据文件。目前正在被广泛使用。
  2. 使用方法 正则表达式常见函数:

re.match函数

原型:match(pattern,string,flags=0)

pattern:匹配的正则表达式

string:要匹配的字符串

flags:标志位,用于控制正则表达式的匹配方式

re.I:忽略大小写

re.L:做本地户识别

re.M:多行匹配

re.S:是匹配包括换行符在内所有字符

re.U:根据Unicode字符集解析字符,影响\w,\W,\B,\b.

re.X:使我们以更灵活的方式理解正则表达式

参数:

功能:尝试从字符串中的起始位置匹配一个模式,如果不是起始位置,

成功的话,返回None

re.search函数

原型:search(pattern,string,flags=0)

同上

功能:扫描整个字符串,并返回第一个成功的匹配

参数:同上

re.findall函数

功能:扫描整个字符串,并返回结果列表

#print(re.findall("benxii","beautiful girl is benxii","benxii is a calm girl"))

有关正则表达式的元字符就不多做介绍,这里我们介绍几种常见场景。方便大家后续查询使用。

3.正则表达式常见使用场景

3.1 提取字符串中的汉字

[\u4E00-\u9FA5\\s]+ 多个汉字,包括空格

[\u4E00-\u9FA5]+ 多个汉字,不包括空格

3.2 提取字符串中的手机号

1[345789]\\d{9}

3.3 提取字符串中的邮箱

代码语言:javascript
复制
emailpattern = '[A-Za-z0-9.\-+_]+@[a-z0-9.\-+_]+\.[a-z]+

3.4 提取字符串的QQ号码

代码语言:javascript
复制
qqpattern = '[1-9]{1}[0-9]{4,11}'

3.5 提取字符串中的邮政编码

代码语言:javascript
复制
youzhengbianmapattern = '\d{6}'

以上内容均经过测试

以上内容仅供参考。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-05-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 python开发教程 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档