前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python正则表达式从入门到实践(3)

Python正则表达式从入门到实践(3)

作者头像
披头
发布2020-06-24 11:01:17
4750
发布2020-06-24 11:01:17
举报
文章被收录于专栏:datartisandatartisan

中文字符匹配

根据前文所述知识,方括号[ ]可以表示枚举、范围、否定等多种含义,几乎可以匹配任意字符,例如,匹配中文字符时,可以使用 [\u0044-\u0088]这样的形式,因为所有的中文字符的UNICODE数值是连续的,只要找出所有中文字符中最小和最大的UNICODE数值,即可用来匹配所有的中文

代码语言:javascript
复制
[\u4e00-\u9fa5]{0,}

邮箱地址匹配

各大公司邮箱地址规则如下:

新浪:4-16个字符,可使用英文小写、数字、下划线,下划线不能在首尾。

搜狐:4-16位,数字、小写字母、点、减号或下划线,小写字母开头。

腾讯:由3-18个英文、数字、点、减号、下划线组成。

网易:6~18个字符,可使用字母、数字、下划线,需以字母开头。

谷歌:您可以使用字母、数字和英文句点,请勿使用除字母 (a-z)、数字和英文句号外的其他字符。

央视:6~20个字符,包括英文字母(小写)数字-_,首尾字符须为字母或数字,且邮箱名不能为纯数字。

TOM: 6-18个字符,仅支持字母、数字及“.”、”-”、”_”,不能全部数字或下划线。

得出通用的邮箱标准:长度不限,可以使用英文(包括大小写)、数字、点号、下划线、减号,首字母必须是字母或数字;

比如有以下邮箱格式:

xxxyyy@zzz.com.cn; 其中"x"可以是纯数字,也可以是纯字母,也可以是数字与字母的组合;

"y"可以是纯数字,可以是纯字母,也可以是数字、字母和指定字符的组合;

"z"可以是纯数字,可以是纯字母,也可以是数字、字母和指定字符"-"的组合, 但不能以字符"-"开头和结尾;

最后的.com和.cn是可以互换位置的,然后也可以只有.com没有.cn或只有.cn没有.com

xxxyyy@zzz.com.cn; 其中"x"可以是纯数字,也可以是纯字母,也可以是数字与字母的组合;

"y"可以是纯数字,可以是纯字母,也可以是数字、字母和指定字符的组合;

"z"可以是纯数字,可以是纯字母,也可以是数字、字母和指定字符"-"的组合, 但不能以字符"-"开头和结尾;

最后的.com和.cn是可以互换位置的,然后也可以只有.com没有.cn或只有.cn没有.com

得出通用的邮箱标准 python 正则表达式:

代码语言:javascript
复制
\w+([-_.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 乐享数据8090 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 中文字符匹配
  • 邮箱地址匹配
相关产品与服务
区块链
云链聚未来,协同无边界。腾讯云区块链作为中国领先的区块链服务平台和技术提供商,致力于构建技术、数据、价值、产业互联互通的区块链基础设施,引领区块链底层技术及行业应用创新,助力传统产业转型升级,推动实体经济与数字经济深度融合。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档