前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >这或许是我见过的最简单的正则表达式教程(三)

这或许是我见过的最简单的正则表达式教程(三)

作者头像
石晓文
发布2018-04-11 16:08:39
5960
发布2018-04-11 16:08:39
举报
文章被收录于专栏:小小挖掘机小小挖掘机

五一劳动节来啦,小小挖掘机们小编们首先祝大家劳动节快乐!

作为中国放假大学的一员,除了趁着长达8天的五一春假好好休整之外,当然还要忙中偷闲补习一下python的基本知识,今天想带代大家补习的是python中的正则表达式。不论你是否掌握python中的正则表达式,相信你看了此次教程之后会对它有一个更深入的理解和掌握。

话不多说,直接上代码:

github链接:https://github.com/princewen/professional-python3

第五节:标记

代码语言:javascript
复制
"""
作者:文文
正则表达式中的标记
python版本:python3.5

"""

import re

"""
re.IGNORECASE | re.I :忽略大小写
re.DOTALL | re.S : .字符在正常情况下不会匹配换行符,但是使用re.S可以使其匹配换行符
re.MULTILINE | re.M : 多行模式,导致仅能够匹配字符串开始与结束的^和$字符可以匹配字符串内任意行的开始与结束
re.VERBOSE | re.X : 允许复杂的正则表达式以更容易阅读的方式表示。导致所有的空白(除了在字符组中的)被忽略,包括换行符,同时将#当作注释字符
re.DEBUG : 编译正则表达式时将一些调试信息输出到sys.stderr

在python2与python3中,一些字符快捷方式的工作机制存在区别,如\w在python3中匹配几乎所有语言的单词,但是在python2中仅匹配英文字符
所以,为了使re模块强制遵循python2或者python3的标准,可以使用如下两个标记
re.Unicode | re.U :re模块强制遵循python3的标准
re.ASCII | re.A :re模块强制遵循python2的标准

使用多个标记:使用|操作符即可

"""
#output : <_sre.SRE_Match object; span=(0, 6), match='Python'>
print (re.search(r'python','Python is awesome',re.I))

#output : <_sre.SRE_Match object; span=(0, 3), match='foo'>
print (re.search(r'.+','foo\nbar'))

#output : <_sre.SRE_Match object; span=(0, 7), match='foo\nbar'>
print (re.search(r'.+','foo\nbar',re.S))

#output : None
print (re.search(r'^bar','foo\nbar'))

#output : <_sre.SRE_Match object; span=(4, 7), match='bar'>
print (re.search(r'^bar','foo\nbar',re.M))

#output : <_sre.SRE_Match object; span=(0, 8), match='873-2323'>
print (re.search(r"""(?P<first_three>[\d]{3}) # the first three digits
                    -                        # a literal hyphen
                    (?P<last_four>[\d]{4})# the last four code
        """,'873-2323',re.X))

第六节:替换

代码语言:javascript
复制
"""
作者:文文
正则表达式中的替换
python版本:python3.5

"""

import re

"""
使用re.sub方法进行字符串替换
"""

# 将匹配到的字符串利用第2、3、4个子匹配内容替换
# output : 2138675309

print (re.sub(r'(\+?1)?[ .-]?\(?([\d]{3})\)?[ .-]?([\d]{3})[ .-]?([\d]{4})',r'\2\3\4','213-867-5309'))

第七节:预编译

代码语言:javascript
复制
"""
作者:文文
预先将正则表达式编译
python版本:python3.5

"""
import re

""" 使用re.comiple对正则表达式进行预先编译"""
pattern = re.compile(r'(\+?1)?[ .-]?\(?([\d]{3})\)?[ .-]?([\d]{3})[ .-]?([\d]{4})')

"""
可以使用如下两种方式进行调用,输出结果一样
<_sre.SRE_Match object; span=(0, 12), match='213-867-5309'>
"""
print (pattern.search('213-867-5309'))
print (re.search(pattern,'213-867-5309'))

想了解更多? 那就赶紧来关注我们

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-05-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小小挖掘机 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档