专栏首页SnailTyan正则表达式

正则表达式

1. 正则表达式

正则表达式(Regular Expression)描述了一种字符串匹配模式,主要用来检索、替换匹配某种模式的字符串。

2. 正则表达式语法

下面以Python代码来展示正则表达式的匹配。

  • . .可以匹配任意单个字符,除了换行符。例如.可匹配abc中的任意一个字符。
import re
print(re.findall(r'.', 'abc'))

# 代码执行结果
['a', 'b', 'c']
  • ^ ^表示字符串的开始,例:^Th表示匹配以Th开头的字符串。
import re
print(re.findall(r'^Th', 'This is a demo. This is a demo.'))

# 代码执行结果
['Th']
  • $ $表示字符串的结束,例:demo$表示匹配以demo结尾的字符串。
import re
print(re.findall(r'demo$', 'This is a demo. This is a demo'))

# 代码执行结果
['demo']
  • * *匹配>=0个在*号之前的字符。例:test*表示匹配以tes为起始值,其后为0个t或多个t的字符串。
import re
print(re.findall(r'test*', 't te tes test testt'))

# 代码执行结果
['tes', 'test', 'testt']
  • + +匹配>=1个在+号之前的字符。例:test+表示匹配以tes为起始值,其后为1个t或多个t的字符串。
import re
print(re.findall(r'test+', 't te tes test testt'))

# 代码执行结果
['test', 'testt']
  • ? ?之前的字符为可选字符。例:test?表示匹配以tes为起始值,其后为1个t或没有t的字符串。
import re
print(re.findall(r'test?', 't te tes test testt'))

# 代码执行结果
['tes', 'test', 'test']
  • \ \为转义字符,用于匹配一些保留的字符[ ] ( ) { } . * + ? ^ $ \ |
import re
print(re.findall(r'test\?', 't te tes test? testt'))

# 代码执行结果
['test?']
  • | |为或运算符,匹配符号前或后的字符。例:te|st表示匹配test的字符串。
import re
print(re.findall(r'te|st', 't te tes test'))

# 代码执行结果
['te', 'te', 'te', 'st']
  • [ ] [ ]表示要匹配的字符种类,匹配方括号内的任意字符。例:[test]匹配括号中的任意一个字符。
import re
print(re.findall(r'[test]', 'This is a test'))

# 代码执行结果
['s', 's', 't', 'e', 's', 't']
  • [^ ] [^ ]表示不进行匹配的字符种类,匹配除了方括号里字符之外的任意字符。
import re
print(re.findall(r'[^test]', 'This is a test'))

# 代码执行结果
['T', 'h', 'i', ' ', 'i', ' ', 'a', ' ']
  • {m,n} {m,n}表示匹配(n-m+1)个大括号之前的字符。例:test{1,2}表示匹配以tes为起始值,其后为1-2t的字符串。
import re
print(re.findall(r'test{1,2}', 'This is a test testt'))

# 代码执行结果
['test', 'testt']
  • (xyz) (xyz)表示匹配与()内容完全相同的字符串。例:(test){1,2}表示匹配1-2testtest是一个整体。
import re
print(re.findall(r'(test){1,2}', 'This is a test testt'))

# 代码执行结果
['test', 'test']
  • \w \w匹配所有字母数字以及下划线,即[a-zA-z0-9_]
import re
print(re.findall(r'\w', 'Is this a test?_'))

# 代码执行结果
['I', 's', 't', 'h', 'i', 's', 'a', 't', 'e', 's', 't']
  • \W \W匹配字母数字以及下划线之外的字符,即[^\w]
import re
print(re.findall(r'\W', 'Is this a test?'))

# 代码执行结果
[' ', ' ', ' ', '?']
  • \d \d匹配数字,即[0-9]
import re
print(re.findall(r'\d', 'test 123'))

# 代码执行结果
['1', '2', '3']
  • \D \D匹配数字之外的字符,即[^\d]
import re
print(re.findall(r'\D', 'test 123'))

# 代码执行结果
['t', 'e', 's', 't', ' ']
  • \s \s匹配所有空格字符,即[\t\n\f\r\p{Z}]
import re
print(re.findall(r'\s', 'test 123\n'))

# 代码执行结果
[' ', '\n']
  • \S \S匹配非空格字符,即[^\s]
import re
print(re.findall(r'\S', 'test 123\n'))

# 代码执行结果
['t', 'e', 's', 't', '1', '2', '3']
  • \n \n匹配一个换行符。
import re
print(re.findall(r'\n', 'test 123\n'))

# 代码执行结果
['\n']
  • \f \f匹配一个换页符。
import re
print(re.findall(r'\f', 'test 123\f'))

# 代码执行结果
['\x0c']
  • \r \r匹配一个回车符。
import re
print(re.findall(r'\r', 'test 123\r'))

# 代码执行结果
['\r']
  • \t \t匹配一个制表符。
import re
print(re.findall(r'\t', 'test 123\t'))

# 代码执行结果
['\t']
  • \v \v匹配一个垂直制表符。
import re
print(re.findall(r'\v', 'test 123\v'))

# 代码执行结果
['\x0b']
  • ?= ?=是前置约束,表示要匹配的是?=之前的内容,但同时要匹配?=之后的内容,前置约束需要使用()。例:Th(?=is)表示要匹配Th,要找的是This中的Th
import re
print(re.findall(r'Th(?=is)', 'There or This or The?'))

# 代码执行结果,匹配的是This中的Th
['Th']
  • ?! ?!也是前置约束,但与?=正好相反,也是要匹配?!之前的内容,但同时要不匹配?!之后的内容,前置约束需要使用()。例:Th(?!is)表示要匹配Th,要找的是非This中的Th
import re
print(re.findall(r'Th(?!is)', 'There or This or The?'))

# 代码执行结果,匹配的是There, The中的Th
['Th', 'Th']
  • ?<= ?<=是后置约束,表示要匹配的是(?<=)之后的内容,但同时要匹配(?<=)括号内的内容,后置约束需要使用()。例:(?<=H)e表示要匹配e,要找的是He中的e
import re
print(re.findall(r'(?<=H)e', 'The or He or She?'))

# 代码执行结果,匹配的是He中的e
['e']
  • ?<! ?<!是后置约束,表示要匹配的是(?<!)之后的内容,但同时要不匹配(?<!)括号内的内容,后置约束需要使用()。例:(?<!H)e表示要匹配e,要找的是非He中的e
import re
print(re.findall(r'(?<!H)e', 'The or He or She?'))

# 代码执行结果,匹配的是The, She中的e
['e', 'e']

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Linux Shell中的命令替换

    Shell脚本中最有用的特性之一就是可以从命令输出中提取信息,并将其赋给变量。有两种方法可以将命令输出赋值给变量。

    Tyan
  • 动手学深度学习(二)——正则化(从零开始)

    版权声明:博客文章都是作者辛苦整理的,转载请注明出处,谢谢! https://blog.csdn....

    Tyan
  • Linux的set命令

    文章作者:Tyan 博客:noahsnail.com | CSDN | 简书

    Tyan
  • Python中的正则

    用户2398817
  • 微信小程序从零开始开发步骤(二)创建小程序页面

    祈澈菇凉
  • 如何用ABAP代码的方式弹出SPRO里的customizing activity

    Jerry Wang
  • 有时创新还真要有点"无知者无畏的精神"

    亚马逊的两种创新 破坏性创新并不涉及特别复杂的技术变革 世界属于那些手上沾着泥巴的人 有时创新还真要有点“无知者无畏的精神” 共计4 条,2213字|建议阅读时...

    邱翔Alex
  • C#常用的集合类型(ArrayList类、Stack类、Queue类、Hashtable类、SortedList类)

    跟着阿笨一起玩NET
  • 一分钟开启Tomcat https支持

    1、修改配置文件 打开tomcat/conf/server.xml配置文件,把下面这段配置注释取消掉, keystorePass为证书密钥需要手动添加,创建证书...

    Java技术栈
  • B2B销售指标研究发现:线索来源决定赢单率

    Implisit分析了数百家公司的销售管道的来源以发现提高渠道转换率的方法。你有关注在正确的线索生成渠道上吗?

    臭豆腐

扫码关注云+社区

领取腾讯云代金券