题目部分
Oracle中的常用正则表达式有哪些?
答案部分
正则表达式就是以某种模式来匹配一类字符串。一旦概括了某类字符串,那么正则表达式即可用于针对字符串的各种相关操作。例如,判断匹配性,进行字符串的重新组合等。正则表达式提供了字符串处理的快捷方式。在Oracle 10g及以后的版本中也支持正则表达式。
元字符是指在正则表达式中表示特殊含义的字符,下表列出了所有的元字符及其含义:
表 3-6 Oracle中的元字符
元字符 | 含义 | 举例 |
---|---|---|
^ | 匹配输入字符串的开始位置。 | ^a:匹配以a开始的字符串 |
$ | 匹配输入字符串的结尾位置。如果设置了RegExp对象Multilin属性,那么$也匹配'n'或'r' | 'a$':匹配以a结束的字符串 |
. | 匹配除换行符\n之外的任何单字符 | |
? | 匹配前面的子表达式零次或一次 | tr(y(ing)?):可以匹配try或者trying |
+ | 匹配前面的子表达式一次或多次 | |
* | 匹配前面的子表达式零次或多次 | |
| | 指明两项之间的一个选择 | '^([a-z]+|[0-9]+)$':表示所有小写字母或数字组合成的字符串 |
() | 标记一个子表达式的开始和结束位置,即字符组。字符组是指将模式中的某些部分作为一个整体。这样,量词可以来修饰字符组,从而提高正则表达式的灵活性。字符组通过()来实现。在许多编程语言中,可以利用“$1”、“$2”等来获取第一个、第二个字符组,即所谓的后向引用。在Oracle中,引用格式为“\1”、“\2” | a(b)*可以匹配ab、abb、abbb、youabb;(c|d)匹配c或d |
[] | 标记一个中括号表达式 | [cd]匹配选择c或d等同于(c|d)。匹配的是单字符,[^cd]是匹配c,d之外的单字符;[a-z]表示所有小写字母;SS[PS]/[VS]匹配:SSP/V、SSP/S、SSS/V、SSS/S |
{m,n} | 一个精确地出现次数范围,m=<出现次数<=n,“{m}”表示出现m次,“{m,}”表示至少出现m次 | |
- | 当使用在a-m时表示范围;当使用在第一个字符时表示连续字符串,如[-abc] |
Oracle字符类如下表所示:
表 3-7Oracle字符类表示
表示 | 含义 | 举例 |
---|---|---|
[[:alpha:]] | 表示任意字母(包含汉字),正则表达式的一般语法为\w,而且\w包含数字 | '^[[:alpha:]]+$':表示全是字符(字母和汉字),不包含数字、空格、标点符号 |
[[:digit:]] | 表示任意数字,正则表达式的一般语法为\d | '^[[:digit:]]+$':表示全是数字 |
[[:lower:]] | 表示任意小写字母 | |
[[:upper:]] | 表示任意大写字母 | |
[[:alnum:]] | 表示任意字母和数字 | |
[[:space:]] | 表示任意空白字符,正则表达式的一般语法为\s,即空格 | |
[[:punct:]] | 表示任意标点符号 | |
[[:xdigit:]] | 表示任意16进制的数字,相当于[0-9a-fA-F] | |
[:print:] | 可打印字符 | |
[:cntrl:] | 控制字符(禁止打印) |
Oracle中支持正则表达式的函数主要有下面四个:
v REGEXP_LIKE:与LIKE的功能相似
v REGEXP_INSTR:与INSTR的功能相似
v REGEXP_SUBSTR:与SUBSTR的功能相似
v REGEXP_REPLACE:与REPLACE的功能相似
它们在用法上与Oracle函数LIKE、INSTR、SUBSTR和REPLACE用法相同,但是它们使用POSIX正则表达式代替了老的百分号(%)和通配符(_)字符,如下表所示:
表 3-8 Oracle正则表达式函数
名称 | 用途 | 语法 | 语法备注 | 举例 | |
---|---|---|---|---|---|
REGEXP_LIKE | 返回值为一个布尔值,可以作为WHERE条件,意味着前边也可以加NOT来取其它情况。如果第一个参数匹配第二个参数所代表的正则表达式,那么将返回真,否则将返回假 | REGEXP_LIKE(source_string,pattern [,match_parameter]) | source_string:源字符串Pattern:正则表达式match_parameter:匹配模式(i:不区分大小写;c:区分大小写;n:允许使用可以匹配任意字符串的操作符;m:将x作为一个包含多行的字符串) | SYS@lhrdb> SELECT ENAME,JOB FROM SCOTT.EMP WHERE REGEXP_LIKE(JOB,'(clerk|analyst)','i');ENAME JOB---------- ---------SMITH CLERKADAMS CLERKJAMES CLERKFORD ANALYST | |
REGEXP_REPLACE | 将source_string中的按regexp匹配到的部分用replacement代替 | REGEXP_REPLACE(source_string,pattern[,replace_string][,position][,occurtence][,match_parameter]) | replace_string:用于替换的字符串position:开始搜索的起始位置occurtence:指定替换第n次出现字符串 | SYS@lhrdb> SELECT REGEXP_REPLACE('09/29/2008','^([0-9]{2})/([0-9]{2})/([0-9]{4})$','\3-\1-\2') REPLACES FROM DUAL;REPLACES----------2008-09-29 | |
REGEXP_SUBSTR | REGEXP_SUBSTR(source_string,pattern[,position[,occurrence[,match_parameter]]]) | position:指定在字符串中准确位置,默认为1occurrence:指定在源字符串匹配过程中相对其它字符串,哪个字符串应该匹配 | SYS@lhrdb> SELECT REGEXP_SUBSTR('The zip code 80831 is for falcon, co','[[:alpha:]]{3,}',1,3) FROM DUAL;REGE----codeSYS@lhrdb> SELECT REGEXP_SUBSTR('<a href= "http://mail.google.com/2009/1009.html">mail link</a>', 'http[a-zA-Z0-9\.:/]*') URL FROM DUAL;URL-------------------------------------http://mail.google.com/2009/1009.html | ||
REGEXP_INSTR | 返回找到的匹配字符串的位置,如果匹配不到则返回0 | REGEXP_INSTR(source_string,pattern[,start_position[,occurrence[,return_option[,match_parameter]]]]) | start_position:开始搜索位置Occurrence:第n次出现pattern,默认为1return_option:0:pattern的起始位置,默认为01:pattern下一个字符起始位置 | SYS@lhrdb> SELECT REGEXP_INSTR('12.158', '\.') POSITION FROM DUAL; POSITION---------- 3 | |
REGEXP_COUNT | Oracle 11g新增的函数,表示pattern在源字符串中出现的次数 | REGEXP_COUNT(source_string,pattern[[,start_position][,match_parameter]]) | start_position:开始搜索的位置 | SYS@lhrdb> SELECT REGEXP_COUNT('23/56/78','/') FROM DUAL;REGEXP_COUNT('23/56/78','/')---------------------------- 2 |
本文选自《Oracle程序员面试笔试宝典》,作者:李华荣。
About Me:小麦苗
● 本文作者:小麦苗,只专注于数据库的技术,更注重技术的运用
● 作者博客地址:http://blog.itpub.net/26736162/abstract/1/
● 本系列题目来源于作者的学习笔记,部分整理自网络,若有侵权或不当之处还请谅解
● 版权所有,欢迎分享本文,转载请保留出处
● 题目解答若有不当之处,还望各位朋友批评指正,共同进步