正则表达式(一)

一、简单介绍

正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如a-z之间的字符)和特殊字符(称为元字符)。它是使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。

别着急,容小伙伴慢慢给你道来,这个东西该怎么玩?

说实话,这货就是用来加强版的windows查找和替换功能,所以要使用它就起码要掌握一些基本知识。其实就字符一共就两类,一类是咱们普遍认识的字符,咱们普遍不认识的字符,叫特殊字符;下面是教程正文:

1、非打印字符

\s:匹配任何空白字符,包括空格、制表、换页符等等,等价于[\f\n\r\t\v];

\S:匹配任何非空白字符,等价于[^\f\n\r\t\v];

\w:表示匹配大小写英文字母、数字以及下划线,等价于[A-Za-z0-9_].

\W:表示匹配除大小写英文字母、数字以及下划线的所有字符,等价于[^A-Za-z0-9_];

\d:表示匹配数字,等价于[0-9];

\D:表示匹配非数字,等价于[^0-9];

\.:匹配除换行符之外的任意单字符;

\f:匹配换页符,等价于\x0c和\cL;

\n:匹配一个换行符,等价于\x0a或\cJ;

\r:匹配一个回车符,等价于\x0d或\cM;

\t:匹配一个制表符,等价于\x09或\cl;

\v:匹配一个崔志制表符,等价于\x0b或\cK;

2、括号的使用

():标记一个子表达式的开始和结束位置,子表达式可以获取供以后使用,通过$1或者$2来调用,从1开始;

[]:囊括一个表达式的范围,即只能符合在里面的表达式。如[\w\n];

{}:对前面的表达式进次数限制,如最少一次,最少一次,最多并且包含八次;

3、关于描述特殊字符的限定:

?:匹配前面的子表达式零次或一次,或指明一个非贪婪界定符;

+:匹配前面的子表达式一次或多次,要匹配+,请使用\+;

*:匹配前面的子表达式零次或多次;

二、实际运用

三、目的:学习正则表达式,可以更好的做数据处理方面的工作;此篇文章我们先简单的学习一下在perl下面如何简单的处理一些不太重

的数据;

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180313G0K8HR00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券