前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一日一技:正则表达式同一个小括号两种意思

一日一技:正则表达式同一个小括号两种意思

作者头像
青南
发布2021-06-23 01:05:31
6360
发布2021-06-23 01:05:31
举报
文章被收录于专栏:未闻Code未闻Code

摄影:产品经理

火锅安排

在Python里面,当我们要从一段正则表达式中提取出一部分内容的时候,我们可以把这部分内容用小括号包起来。例如:从字符串我的密码123456abc中提取123456abc,我们可以这样写正则表达式:

代码语言:javascript
复制
import re

s = '我的密码123456abc'
password = re.findall('密码(.*?)$', s)
print(password)

运行效果如下图所示:

在这个例子里面,小括号的意思是“分组”。

但是,在正则表达式里面,小括号还有另外一个意思,那就是把几个符号放在一起,作为一个整体。

例如,还有另一个字符串我的口令123456abc,这里密码前面是口令,为了使用同一个正则表达式来从这两个句子里面提取密码,那么需要表达密码或口令(.*?)$这个意思。

但如果我们这样写:

代码语言:javascript
复制
密码|口令(.*?)$

它实际上表达的意思是密码令(.*?)或者密口令(.*?)

所以我们需要把(密码)口令作为整体来看待。此时,正则表达式本身支持使用括号来表示:

代码语言:javascript
复制
(密码|口令)(.*?)$

在正则表达式里面,小括号内部的|左右两侧的多个字符串会作为整体,这样就能表示密码(.*?)或口令(.*?)了。

但是,正则表达式里面作为整体的小括号,与Python里面用来分组的小括号发生了冲突,于是我们会发现提取出来的内容并不是我们想要的:

可以看到,这里,(密码|口令)它同时即有正则表达式里面作为整体的功能,又有Python里面分组的功能。于是结果多出来了我们不想要的东西。

那么有什么办法让(密码|口令)只实现正则表达式里面的作为整体的功能,不实现Python里面的分组功能呢?这个时候就需要使用正则表达式里面的一个组合符号?:了。

请大家对比下面三个结果:

可以看到,>.*?<<(?:.*?)>的作用是一样的。这就说明,以?:开头的小括号,它失去了分组的功能。

因此,我们把这个特征用到一开始的例子中:

代码语言:javascript
复制
>>> import re
>>> s = '我的密码123456abc'
>>> re.findall('(?:密码|口令)(.*?)$', s)
['123456abc']
>>> s = '我的口令123456abc'
>>> re.findall('(?:密码|口令)(.*?)$', s)
['123456abc']

运行效果如下图所示,完成任务:

未闻 Code技术交流群开放啦!群里既有国内一二线大厂在职员工,也有国内外高校在读学生,既有十多年码龄的编程老鸟,也有中小学刚刚入门的新人,学习氛围良好!想入群的同学,请添加我的微信“mekingname”,备注“粉丝群”(谢绝广告党,非诚勿扰!)~

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-06-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 未闻Code 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档