前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python语言的自学之路3

python语言的自学之路3

作者头像
py3study
发布2020-01-03 16:25:59
3400
发布2020-01-03 16:25:59
举报
文章被收录于专栏:python3python3

正则匹配里面方法分为两种使用方法:

方法1:

import re

str = ‘i am a bad hero'

re.search(‘am’,str)

re.match(‘am’,str)

re.findall(‘am’,str)

re.finditer(‘am’,str)

方法2:

import re

str = ‘i am a bad hero’

pat = re.compile(r‘am’)  #r的意思是原生字符串

pat.match(str)

方法区别在于,当多次使用相同的匹配规则时,方法2由于compile已经缓存了匹配规则,所以执行多次的效率高于方法1.

原生字符串

假如你需要匹配文本中的字符"\",那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\\\”,

Python里的原生字符串很好地解决了这个问题,这个例子中的正则表达式可以使用r"\\”表示,匹配一个数字的"\\d"可以写成r"\d"。

re.compile(strPattern[, flag]):

这个方法是Pattern类的工厂方法,用于将字符串形式的正则表达式编译为Pattern对象。

第二个参数flag是匹配模式,取值可以使用按位或运算符'|'表示同时生效,比如re.I | re.M。

另外,你也可以在regex字符串中指定模式,

比如re.compile('pattern', re.I | re.M)与re.compile('(?im)pattern')是等价的。

可选值有:

   re.I(全拼:IGNORECASE): 忽略大小写(括号内是完整写法,下同)

  re.M(全拼:MULTILINE): 多行模式,改变'^'和'$'的行为(参见上图)

   re.S(全拼:DOTALL): 点任意匹配模式,改变'.'的行为

   re.L(全拼:LOCALE): 使预定字符类 \w \W \b \B \s \S 取决于当前区域设定

   re.U(全拼:UNICODE): 使预定字符类 \w \W \b \B \s \S \d \D 取决于unicode定义的字符属性

   re.X(全拼:VERBOSE): 详细模式。这个模式下正则表达式可以是多行,忽略空白字符,并可以加入注释

以下两个正则表达式a和b是等价的:

a = re.compile(r"""\d +  # the integral part

                  \.    # the decimal point

                  \d *  # some fractional digits""", re.X)  

b = re.compile(r"\d+\.\d*")  

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/09/24 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档