专栏首页小小挖掘机这或许是我见过的最简单的正则表达式教程(三)

这或许是我见过的最简单的正则表达式教程(三)

五一劳动节来啦,小小挖掘机们小编们首先祝大家劳动节快乐!

作为中国放假大学的一员,除了趁着长达8天的五一春假好好休整之外,当然还要忙中偷闲补习一下python的基本知识,今天想带代大家补习的是python中的正则表达式。不论你是否掌握python中的正则表达式,相信你看了此次教程之后会对它有一个更深入的理解和掌握。

话不多说,直接上代码:

github链接:https://github.com/princewen/professional-python3

第五节:标记

"""
作者:文文
正则表达式中的标记
python版本:python3.5

"""

import re

"""
re.IGNORECASE | re.I :忽略大小写
re.DOTALL | re.S : .字符在正常情况下不会匹配换行符,但是使用re.S可以使其匹配换行符
re.MULTILINE | re.M : 多行模式,导致仅能够匹配字符串开始与结束的^和$字符可以匹配字符串内任意行的开始与结束
re.VERBOSE | re.X : 允许复杂的正则表达式以更容易阅读的方式表示。导致所有的空白(除了在字符组中的)被忽略,包括换行符,同时将#当作注释字符
re.DEBUG : 编译正则表达式时将一些调试信息输出到sys.stderr

在python2与python3中,一些字符快捷方式的工作机制存在区别,如\w在python3中匹配几乎所有语言的单词,但是在python2中仅匹配英文字符
所以,为了使re模块强制遵循python2或者python3的标准,可以使用如下两个标记
re.Unicode | re.U :re模块强制遵循python3的标准
re.ASCII | re.A :re模块强制遵循python2的标准

使用多个标记:使用|操作符即可

"""
#output : <_sre.SRE_Match object; span=(0, 6), match='Python'>
print (re.search(r'python','Python is awesome',re.I))

#output : <_sre.SRE_Match object; span=(0, 3), match='foo'>
print (re.search(r'.+','foo\nbar'))

#output : <_sre.SRE_Match object; span=(0, 7), match='foo\nbar'>
print (re.search(r'.+','foo\nbar',re.S))

#output : None
print (re.search(r'^bar','foo\nbar'))

#output : <_sre.SRE_Match object; span=(4, 7), match='bar'>
print (re.search(r'^bar','foo\nbar',re.M))

#output : <_sre.SRE_Match object; span=(0, 8), match='873-2323'>
print (re.search(r"""(?P<first_three>[\d]{3}) # the first three digits
                    -                        # a literal hyphen
                    (?P<last_four>[\d]{4})# the last four code
        """,'873-2323',re.X))

第六节:替换

"""
作者:文文
正则表达式中的替换
python版本:python3.5

"""

import re

"""
使用re.sub方法进行字符串替换
"""

# 将匹配到的字符串利用第2、3、4个子匹配内容替换
# output : 2138675309

print (re.sub(r'(\+?1)?[ .-]?\(?([\d]{3})\)?[ .-]?([\d]{3})[ .-]?([\d]{4})',r'\2\3\4','213-867-5309'))

第七节:预编译

"""
作者:文文
预先将正则表达式编译
python版本:python3.5

"""
import re

""" 使用re.comiple对正则表达式进行预先编译"""
pattern = re.compile(r'(\+?1)?[ .-]?\(?([\d]{3})\)?[ .-]?([\d]{3})[ .-]?([\d]{4})')

"""
可以使用如下两种方式进行调用,输出结果一样
<_sre.SRE_Match object; span=(0, 12), match='213-867-5309'>
"""
print (pattern.search('213-867-5309'))
print (re.search(pattern,'213-867-5309'))

想了解更多? 那就赶紧来关注我们

本文分享自微信公众号 - 小小挖掘机(wAIsjwj),作者:文文

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-05-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 漫画带你图解强化学习

    最近五年,是强化学习(Reinforcement Learning, RL)爆发的时期。RL是机器学习大家族中的一大类, 使用强化学习能够让机器学着如何在环境中...

    石晓文
  • 推荐系统遇上深度学习(十六)--详解推荐系统中的常用评测指标

    最近阅读论文的过程中,发现推荐系统中的评价指标真的是五花八门,今天我们就来系统的总结一下,这些指标有的适用于二分类问题,有的适用于对推荐列表topk的评价。

    石晓文
  • 通俗讲解集成学习算法!

    本文以图文的形式对模型算法中的集成学习,以及对集中学习在深度学习中的应用进行了详细解读。

    石晓文
  • python运维开发笔记4

    ['mysql','-u','root','-p123','-e','show processlist']

    py3study
  • Python 正则表达

    pattern 就是正则表达式字符串,flags是选项。正则表达需要被编译,为了提高提高效率,这些编译后的结果被保存,下次使用同样的pattern 的时候,就不...

    江小白
  • python re模块常见函数

    如果想要从源字符串的起始位置匹配一个模式,我们可以使用re.match()函数。re.match()函数的使用格式是: re.match(pattern, st...

    py3study
  • python笔记:正则表达式

    超级大猪
  • python中去掉文件的注释

        re.VERBOSE | re.MULTILINE | re.DOTALL

    py3study
  • python 正则匹配的re.sear

    影响'^'和'$'的行为,指定了以后,'^'会增加匹配每行的开始(也就是换行符后的位置);'$'会增加匹配每行的结束(也就是换行符前的位置)。

    py3study
  • Python3 正则表达式特殊符号及用法.md

    正则表达式(Regular expressions 也称为 REs,或 regexes 或 regex patterns)本质上是一个微小的且高度专业化的编程语...

    WeiyiGeek

扫码关注云+社区

领取腾讯云代金券