正则表达式regular expression用于描述一种字符串匹配的模式pattern,它可用于检查一个字符串是否包含某个子字符串,也可用于从字符串中提取匹配的子字符串,或者对字符串中匹配的子字符串进行替换操作...Python正则表达式常用于进行数据清洗、数据抓取、网络爬虫等工作,能达到事半功倍的效果,非常值得学习。
正则表达式的构成元素
正则表达式由普通字符和特殊字符(也叫元字符或限定符)组成。...x=0 or x=1
{n} x=n
{n,} x>=n
{n,m} n<=x<=m
字符组
[…] 表示枚举,匹配中括号内字符之一. 如: [xyz] 匹配字符 x, y 或 z....如果中括号中包含元字符, 则元字符降级为普通字符, 不再具有元字符的功能, 如 [+.?] 匹配 加号, 点号或问号....多选结构
| 就是或的意思, 表示两者中的一个. 如: a|b 匹配a或者b字符.
括号
括号 常用来界定重复限定符的范围, 以及将字符分组.