前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >MySQL(三)用正则表达式搜索

MySQL(三)用正则表达式搜索

作者头像
allsmallpig
发布2021-02-25 11:01:20
9770
发布2021-02-25 11:01:20
举报
文章被收录于专栏:allsmallpi博客

正则表达式是用来匹配文本的特殊的串(字符集合),将一个模式(正则表达式)与一个文本串进行比较;

所有种类的程序设计语言、文本编辑器、操作系统等都支持正则表达式,正则表达式用正则表达式语言来建立;

MySQL仅支持多数正则表达式实现的一个很小的子集;

一、基本字符匹配

select column from table where column regexp ‘1000’ order by column;

该语句检索列column包含文本1000的所有行;它告诉MySQL:regexp后所跟的东西作为正则表达式(与文字正文1000匹配的一个正则表达式)处理。

select column from table where column regexp ‘.000’ order by column;

该语句中的正则表达式(.),是正则表达式语言中的一个特殊字符,表示匹配任意一个字符(该语句也可以使用like和通配符完成)

like和regexp的区别:

①like匹配整个列;

select column from table where column regexp ‘1000’ order by column;

该SQL语句将不返回数据,因为like匹配整个列,如果被匹配的文本在列值中出现,like将不会找到它,相应的行也不会被返回(除非使用通配符)

②regexp在列值内进行匹配

select column from table where column regexp ‘1000’ order by column;

该SQL语句会返回一行数据,如果被匹配的文本在列值中出现,regexp将会找到它,相应的行将被返回(如果希望regexp匹配整个列值,使用^和$定位符{anchor})即可

MySQL中正则表达式匹配不区分大小写,如希望区分大小写,可使用binary关键字,如where column regexp binary ‘test .000’

二、进行or匹配

select column from table where column regexp ‘X|Y’ order by column;

or表示匹配其中之一,功能雷雨与select语句中的or语句,多个or条件可并入单个正则表达式

三、匹配几个字符之一

select column from table where column regexp ‘[XYZ]test’ order by column;

[]是另一种形式的or语句,作用是匹配指定的(其中之一)字符;正则表达式[XY]test为[X|Y|Z]test的缩写,它的意思是匹配X或者Y或者Z

字符集合也可以被否定,即匹配除指定字符外的任何东西,为否定一个字符集,可以在集合开始处设置一个‘^’例如[^XYZ]([]定义更准确,|如果不括起来,则应用于整个串)

四、匹配范围

集合可以用来定义要匹配的一个或多个字符

比如[0123456789],为了简化这种类型的集合,可使用(-)来定义一个范围,即[0-9];(范围不仅仅局限于数值,还可以使字母字符等)

五、匹配特殊字符

正则表达式由具有特定含义的特殊字符构成;如果要匹配这些特殊字符,就需要用\\为前导;\\-表示查找-,\\.表示查找.

select column from table where column regexp ‘\\-’ order by column;

这种处理方式就是所谓的转义(escaping),正则表达式内具有特殊意义的所有字符都必须以这种方式转义;(为了匹配反斜杠{\}字符本身,需要使用\\\)

PS:多数正则表达式实现使用单个反斜杠转义特殊字符,以便能够使用这些字符本身,而MySQL要求两个反斜杠(MySQL自己解释一个,正则表达式库解释一个)

\\也用来引用元字符(具有特殊含义的字符),如下:

六、匹配字符类

字符类(character class):有时候需要检索出我们需要的数字、所有字母字符或所有数字字母字符等的匹配,我们可以使用预定义的字符集,称为字符类;如下:

七、匹配多个实例

有时候需要对匹配的数目进行更强的控制,比如:寻找所有的数,不管数中包含多少数字,或寻找一个单词并尾随一个s(如果存在)等情况,我们可以利用正则表达式中的重复元字符来完成;如下

select column from table where column regexp ‘\\([0-9] sticks?\\)’ order by column;

上面的正则表达式‘\\([0-9] test?\\)’意为:\\匹配([0-9]匹配任意数字,这里指匹配的数值范围,sticks?匹配stick和sticks{?使s可选,因为?匹配它前面任何字符的0或者1次出现})

八、定位符

有时候为了匹配特定位置的文本,需要使用定位符,常用定位符列表如下:

例如:找出一个以一个数(包括小数点开始的数)开始的所有数值,简单搜索[0-9\\.]或([[:digit:]\\.])不行,因为它将在文本内任意位置查找匹配,可以使用^定位符,如下

select column from table where column regexp '^[0-9\\.]' order by column;

^匹配串的开始,有两种用法:

①在集合中(用[和]定义),用它来否定该集合

②用来指串的开始处

使regexp和like起相同作用:like匹配整串二regexp匹配子串,可以利用定位符,用^开始每个表达式,用$结束每个表达式,就可以使regexp和like作用一样

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018/03/22 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云数据库 SQL Server
腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档