# 正则模块
"""
1、用于实现正则表达式功能
"""
主要方法
# 引用模块
import re
# 查找所有,返回值是列表,将所有匹配的内容放入列表
# 格式re.findall(''要查找的内容, '在哪个字符串中查找')
r1 = re.findall('abc', 'abcsssabcjjjabc')
print(r1)
# 查找第一个,找到后结束,返回一个对象包括位置和匹配的字符串
# 通过group打印匹配内容
r2 = re.search('abc', 'abcsssabcjjjabc')
print(r2)
print(r2.group())
# 只在字符串开始匹配,找到后结束,返回一个对象包括位置和匹配的字符串
# 通过group打印匹配内容
r3 = re.match('abc', 'abcasddssabc')
print(r3)
print(r3.group())
# 分割
r4 = re.split('abc', 'asdfsdabcsders')
print(r4)
# 替换
r5 = re.sub('abc', 'def', 'adasdasdabc')
print(r5)
# 表达式
# 将匹配规则定义成一个对象,使用同一个匹配规则调用该对象
obj1 = re.compile('abc')
r6 = obj1.findall('abcsssabcjjjabc')
print(r6)
正则表达式
# 正则表达式
"""
1、正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。
2、正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
"""
# 字符匹配
"""
1、普通字符:大多数字符和字母都会和自身匹配
2、元字符:在匹配时拥有特殊含义的字符
通配符‘.’:代指任意一个字符(除了换行符),一个‘.’只能匹配一位。
‘^’:以指定字符开头。
‘$’:以指定字符结尾。
‘*’:重复匹配,重复前面字符多次(包括0)
‘+’:重复匹配,重复前面字符多次(最少有一个)
‘?’:重复匹配,重复前面字符多次(0次或1次)
‘{}’:重复匹配,重复前面字符多次(重复几次自己定义,也可以指定范围)
字符集‘[]’:代表范围,并取消里面元字符的功能(^\-例外)
[a-z]:所有小写字母
[A-Z]:所有大写字母
[1-9]:数字范围
[^]:取反,所有在[]里面的字符不会被匹配
‘\’:后面跟元字符去除元字符特殊含义,后面跟普通字符实现特殊含义。
\w:匹配任何字母或数字或下划线或汉字 等价于 '[A-Za-z0-9_]'。
\W:匹配任何非字母或数字或下划线或汉字 等价于 '[^A-Za-z0-9_]'。
\s:匹配任意的空白符,相当于[\t\n\r\f\v]
\S:匹配任意非的空白符,相当于[^\t\n\r\f\v]
\d:匹配任意十进制数字
\D:匹配非十进制数字
\b:匹配单词边界,单词的开始或结束
‘()’:分组,将‘()’作为一个整体
‘|’:或关系
3、特殊的存在
r'':表示该字符串中的内容在python解释器中没有特殊含义,但是其正则含义仍然生效
贪婪匹配:匹配最多
惰性匹配:匹配最少
"""
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。