前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python正则表达式:最短匹配

Python正则表达式:最短匹配

作者头像
jhao104
发布2018-03-20 16:41:26
2.8K0
发布2018-03-20 16:41:26
举报
文章被收录于专栏:烂笔头烂笔头

目录[-]

最短匹配应用于:假如有一段文本,你只想匹配最短的可能,而不是最长。

例子

比如有一段html片段,<a>this is first label</a><a>the second label</a>,如何匹配出每个a标签中的内容,下面来看下最短与最长的区别。

代码

代码语言:javascript
复制
>>> import re
>>> str = '<a>this is first label</a><a>the second label</a>'

>>> print re.findall(r'<a>(.*?)</a>', str)  # 最短匹配
['this is first label', 'the second label']

>>> print re.findall(r'<a>(.*)</a>', str)
['this is first label</a><a>the second label']

解释

例子中,模式r'<a>(.*?)</a>的意图是匹配被< a>和< /a>包含的文本,但是正则表达式中*操作符是贪婪的,因此匹配操作会查找出最长的可能。 但是在*操作符后面加上?操作符,这样使得匹配变成非贪婪模式,从而得到最短匹配。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2015年3月11日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 例子
  • 代码
  • 解释
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档