Python正则表达式re库的使用

指导思想:正则表达式只是一个工具,学会其中一种使用方法即可

1. ()和re.findall结合使用

({}{})中第一个大括号替换为.则表示匹配所有字符,替换为[]则表示匹配中括号内限定的字符;
第二个大括号替换为*则表示匹配长度为>=0,替换为+则表示匹配长度为>=1,替换为空则表示匹配长度为1
(.*)表示匹配任意长度的所有字符
([0-9]*)表示匹配任意长度的数字
([0-9,a-z])表示匹配长度为1的数字和小写字母
re.findall函数需要传入2个参数,第1个参数是正则表达式,第2个参数是要进行搜索的源字符串。
re.findall函数返回结果的数据类型为列表,列表中的第1个元素的数据类型为元祖。

示例代码如下:

import re

if __name__ == "__main__":
  sourceStr = "11房5厅8卫"
  sourceStr2 = "a房b厅3卫"
  pattern_all = "(.*)房(.*)厅(.*)卫"
  pattern_number = "([0-9]*)房([0-9]*)厅([0-9]*)卫"
  pattern_numberAndLetter = "([0-9,a-z])房([0-9,a-z])厅([0-9,a-z])卫"
  print("正则表达式找出中间的字符:")
  result = re.findall(pattern_all, sourceStr)
  print(result,type(result),type(result[0]))
  print(re.findall(pattern_all,sourceStr2))
  print("正则表达式找出中间的数字")
  print(re.findall(pattern_number,sourceStr))
  print(re.findall(pattern_number,sourceStr2))
  print("正则表达式找出中间的数字和字母")
  print(re.findall(pattern_numberAndLetter, sourceStr))
  print(re.findall(pattern_numberAndLetter, sourceStr2))

上面一段代码的运行结果如下:

正则表达式找出中间的字符: [('11', '5', '8')] <class 'list'> <class 'tuple'> [('a', 'b', '3')] 正则表达式找出中间的数字 [('11', '5', '8')] [] 正则表达式找出中间的数字和字母 [('1', '5', '8')] [('a', 'b', '3')]

2. 正则表达式中的元字符

\s 用于匹配单个空格符,包括tab键和换行符; 
\S 用于匹配除单个空格符之外的所有字符; 
\d 用于匹配从0到9的数字; 
\w 用于匹配字母,数字或下划线字符; 
\W 用于匹配所有与\w不匹配的字符; 
. 用于匹配除换行符之外的所有字符。
例如上一节中的([0-9]*)与([\d]*)作用相同

3. ()和re.search结合使用

re.search函数需要传入2个参数,第1个参数是正则表达式,第2个参数是要进行搜索的源字符串。 re.search函数返回结果的数据类型是sre.SRE_Match对象,span=(3,9)是匹配结果的索引,从索引3开始,不包括索引9。 把re.search函数返回结果赋值给result,通过result.group函数获取匹配结果,result.group函数需要传入1个参数,参数的数据类型为无符号整型,参数为0时,为正则表达式匹配到的长句内容;参数为1时,为正则表达式匹配到的第1个小括号中的内容;参数为2时,为正则表达式匹配到的第2个小括号中的内容,依此类推。 示例代码如下:

import re

if __name__ == "__main__":
  sourceStr = "户型:3室2厅2卫"
  pattern_all = "([\d]*)室(.)厅(.)卫"
  result = re.search(pattern_all,sourceStr)
  print(result)
  print(result.group(0))
  print(result.group(1))
  print(result.group(2))
  print(result.group(3))

上面一段代码的运行结果如下:

<_sre.SRE_Match object; span=(3, 9), match='3室2厅2卫'> 3室2厅2卫 3 2 2

4 re.match的使用

re,match在实际应用中很少,不建议使用。 re.match能够匹配的前提是必须字符串索引0的位置能够匹配到。

import re
if __name__ == "__main__":
  re1 = "hel."
  re2 = ".el"
  re3 = ".hel"
  re4 = "el"
  sourceStr = "hello"
  print(re.match(re1,sourceStr))
  print(re.match(re2,sourceStr))
  print(re.match(re3,sourceStr))
  print(re.match(re3,sourceStr))

上面一段代码的运行结果如下:

<_sre.SRE_Match object; span=(0, 4), match='hell'> <_sre.SRE_Match object; span=(0, 3), match='hel'> None None

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏lzj_learn_note

1-python基础

​ 同一个变量a可以反复赋值,且可以是不同类型的变量. 这种变量本身类型不固定的语言称为动态语言, 比如python, javascript....

29120
来自专栏Java帮帮-微信公众号-技术文章全总结

第四天 数组【悟空教程】

22490
来自专栏noteless

-1-1 java 基础语法 java关键字 java 注释 常量 语句 运算符 函数 数组定义

字符/数字/下划线/$/  组成  不可以使用关键字 不允许以数字开头    严格区分大小写

19120
来自专栏PHP在线

PHP函数

请点击上面蓝色PHP关注 你知道这些简单的函数中的方法吗? count() 函数计算数组中的单元数目或对象中的属性个数。 对于数组,返回其元素的个数,对于其他值...

30550
来自专栏Python小屋

Python内置函数sorted()和列表方法sort()排序规则不得不说的事

Python内置函数sorted()和列表方法sort()可以使用key参数指定排序规则,并且都是稳定排序,也就是说,对于指定规则不能涵盖的元素,本来谁在前面,...

28130
来自专栏牛客网

知识总结:四个例子理解闭包//例一//例二//例三//例四

/** * 闭包原理 * @date   2017-04-10 14:04:17 * @version 1 */ //理解作用域、作用域链 //内部作用域可以通...

35990
来自专栏深度学习计算机视觉

java正则表达式详解

正则表达式用于指定字符串的模式,你可以任何需要定位使用匹配某种特定模式的字符串的情况下使用正则表达式 jdk1.4推出java.util.regex包,就为我们...

29440
来自专栏desperate633

LintCode 移动零题目分析

给一个数组 nums 写一个函数将0 移动到数组的最后面,非零元素保持原数组的顺序

8720
来自专栏尾尾部落

[剑指offer] 数组中重复的数字

在一个长度为n的数组里的所有数字都在0到n-1的范围内。 数组中某些数字是重复的,但不知道有几个数字是重复的。也不知道每个数字重复几次。请找出数组中任意一个重复...

10630
来自专栏desperate633

LintCode 字符大小写排序题目分析代码

9110

扫码关注云+社区

领取腾讯云代金券