前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Qt正则表达式类QRegExp(附检验小程序)

Qt正则表达式类QRegExp(附检验小程序)

作者头像
花狗Fdog
发布2020-10-28 11:34:28
6.5K0
发布2020-10-28 11:34:28
举报
文章被收录于专栏:花狗在Qt

在许多场景中,我们需要验证用户输入的数据是否有效,或者是查找并修改文本,或者是提取指定数据,为此,相对于Qstring的一些函数,QT提供了一个更加强大的类——QRegExp,使用函数配合正则表达式来操作字符串,QRegExp可以进行下面的操作,并附带检验小程序,可在文末下载。

在这里插入图片描述
在这里插入图片描述

一.正则表达式相关函数用法

1.提取数据

matchedLength() 匹配的长度

capturedTexts() 捕捉到的字符串列表,   对应的还有captureCount() ,获取表达式中含有的捕捉组的数目

cap(int n) 第n个组的内容(0代表匹配自身)

  • cap()参数缺省值为0。
  • cap(0):表示匹配的整个文本的值。
  • cap(1):表示第1个圆括弧中的值。
  • cap(2):表示第2个圆括弧中的值。

pos(int n) 第n个组的位置(默认值为0)

QRegExp::indexIn() 搜索字符串以找到匹配的字串,返回索引值,失败返回-1

QRegExp::lastIndexIn() 同上,只是从后向前搜索

代码语言:javascript
复制
        QString str = "(.*)=(.*)";
        QRegExp rx_1(str);
        QString str_1 = ("a=100");
        int pos = rx_1.indexIn(str_1);
        if(pos>=0)
        {
            qDebug()<<rx_1.matchedLength(); //5
            qDebug()<<rx_1.capturedTexts(); //("a=100", "a", "100")
            qDebug()<<rx_1.cap(0);//"a=100"
            qDebug()<<rx_1.cap(1);//"a"
            qDebug()<<rx_1.cap(2);//"100"
            qDebug()<<rx_1.pos(0);//0
            qDebug()<<rx_1.pos(1);//0
            qDebug()<<rx_1.pos(2);//2
        }

(?:pattern)是非捕获型括号 匹配pattern,但不捕获匹配结果 (pattern)是捕获型括号。 匹配pattern,匹配pattern并捕获结果,自动获取组号 (?<name> pattern ) 匹配pattern, 匹配pattern并捕获结果,设置name为组名 例如,将(.*)=(.*)改为(?:.*)=(.*),qDebug()<<rx_1.cap(1);该值将为100,而 qDebug()<<rx_1.cap(2);将为空。

2.修改文本

       将匹配到的字符串替换成其他字符串,例如将文本中的a=100修改为b=100

代码语言:javascript
复制
QString str = "a=100";
s.replace(QRegExp("(.*)="),"b=");

       将匹配到的字符串内容进行自定义或替换,例如将文本中的a=100修改为100=a

代码语言:javascript
复制
Qstring str = "a=100";
s.replace(QRegExp("(.*)=(.*)"),"\\2=\\1");// \\1就是相当于cap(1),表示第1个圆括弧中的值。

3.验证文本有效性

       这里用到QRegExp::exactMatch来判断输入的字符是否符合正则表达式。

QRegExp::exactMatch() 判断字符串是否完全(从头到尾)匹配,返回真或假

代码语言:javascript
复制
    QRegExp rx("\\d"); //正则表达式
    bool match = rx.exactMatch("8");//验证文本
    if(match == true)
    {
        //表达式正确

        return;
    }
        //表达式错误

对此,QRegExp都有相对应的函数方法,还有一些函数上面没有写出来,例如:

isValid();//判断正则表达式是否合法,合法返回true,否则返回false。 pattern();//获得正则本身

其他完整函数,大家可在文末点击官方文档查阅,当然,所有的函数方法都离不开一个核心就是正则表达式,我们来看下。

二.正则表达式

正则表达式是由表达式+量词+断言组成。

首先是表达式:

例子

含义

c

除非具有特殊的正则表达式含义(., ^, $, [, ], * , +, ? ),否则字符表示自身。例如c匹配字符c

\c

除以下指定的字符外,反斜杠后面的字符与字符本身匹配。例如,要匹配字符串开头的文字插入符,请写\ ^

\a

匹配ASCII铃声(BEL,0x07)

\f

匹配ASCII换页(FF,0x0C)

\n

匹配ASCII换行符(LF,0x0A,Unix换行符)

\r

匹配ASCII回车(CR,0x0D)

\t

与ASCII水平制表符(HT,0x09)匹配

\v

匹配ASCII垂直制表符(VT,0x0B)。

.(dot)

匹配任何字符(包括换行符)

\d

匹配一个数字

\D

匹配一个非数字。

\s

匹配一个空白字符

\S

匹配非空格字符。

\w

任意单字字符(字母,数字或者下划线)

\W

任意非单字字符

\n

第n个反向引用,例如\ 1,\ 2等。

注意: C ++编译器将反斜杠转换为字符串。要将\包含在正则表达式中,请输入两次,即\\。要匹配反斜杠字符本身,请输入四次,即\\\\。

最简单的一个正则表达式就是字符,例如:

  • a 匹配字符a
  • b 匹配字符b
  • 9 匹配数字9

表达式后面可以加量词,默认情况下,表达式会自动由{1,1}进行量化,即它应该只出现一次。在下面的列表中,E代表表达。表达式是一个字符,或者是一组字符的缩写,或者在方括号中是一组字符,或者在括号中是表达式。

例子

解释

E?

?代表0个或1个

E*

*代表0个或1个或多个

E+

+代表1个或多个

E{3}

匹配3次

E{3,}

匹配大于等于3次

E{,6}

匹配至多m次,等价于a{0,m}

E{3,6}

匹配至少3次,至多6次(包括3和6)

例如:

  • E?匹配0次或者1次E
  • E+ 匹配1次或者多次E
  • E{3,6} 匹配至少3次,至多6次E

可以在表达式和量词的基础,加入断言,进行一些限制,例如我们想要匹配0-9,我们可以将正则表达式写为/d,如果我们想要匹配0-99,我们可以写成[0-9]{1,2},这时,字符串“89”符合,字符串“我们今年21岁了”也符合,因为里面有21,单独使用[0-9]{1,2},它会匹配包括出现在字符串中间的整数,如果想匹配的整数是整个字符串,那么就需要使用断言“^”和“$”了。 断言在正则表达式中出现的位置对文本进行一些声明,但不匹配任何字符。在以下列表中,E代表任何表达式。

例子

解释

^

尖号表示字符串的开头。如果您想匹配文字,则必须通过书写将其转义\。例如,^#include将仅匹配以字符’#include’开头的字符串。(当插入号是字符集的第一个字符时,它具有特殊含义,请参见字符集。)

$

美元表示字符串的结尾。例如,\ d \ s * 将 匹 配 以 数 字 结 尾 ( 可 选 ) 后 跟 空 格 的 字 符 串 。 如 果 您 想 匹 配 文 字 将匹配以数字结尾(可选)后跟空格的字符串。如果您想匹配文字将匹配以数字结尾(可选)后跟空格的字符串。如果您想匹配文字,则必须通过书写将其转义\$。

\b

单词边界。例如,正则表达式\ bOK \ b表示在单词边界(例如字符串或空白的开头)之后立即匹配字母“ O”,然后紧接在另一个单词边界(例如字符串或空白的结尾)之前匹配字母“ K”。但是请注意,该断言实际上并不与任何空格匹配,因此如果我们编写(\ bOK \ b)并且具有匹配项,即使该字符串为“ It’s OK now”,它也将仅包含“ OK ”。

\B

非单词边界。只要\ b为假,该断言就为真。例如,如果我们在“ Left on”中搜索\ Bon \ B,则匹配将失败(字符串的空格和结尾不是非单词边界),但将在“ t on ne”中匹配。

(?= E)

如果表达式此时在regexp中匹配,则此断言为true。

(?!E)

如果此表达式在regexp中不匹配,则此断言为true。

除此之外,还有其他一些其他字符可以和表达式组合,方括号表示匹配方括号中包含的任何字符。上述字符集缩写可以出现在方括号中的字符集中。除字符集缩写和以下两个例外外,字符在方括号中没有特殊含义。

例子

含义

^

如果字符集作为第一个字符出现(即紧接在方括号之后),则插入符将否定该字符集。[ABC]匹配’a’或’b’或’c’的,但[^ ABC]匹配任何但’a’或’b’或’c’的。

-

破折号表示字符范围。[W-Z]与“ W”或“ X”或“ Y”或“ Z”匹配。

通配符匹配,大多数命令外壳(如bash或cmd.exe)都支持“文件通配”,即使用通配符标识一组文件的能力。所述setPatternSyntax()函数用于正则表达式和通配符模式之间切换。通配符匹配比完整的正则表达式简单得多,并且只有四个功能:

例子

解释

c

除了下面提到的那些字符以外,任何字符都代表自己。因此,c与字符c相匹配。

?

匹配任何单个字符。与相同。在完整的正则表达式中。

*

匹配零个或多个任何字符。与完整正则表达式中的。*相同。

[…]

字符集可以用方括号表示,类似于完整的正则表达式。在字符类中,与外部一样,反斜杠没有特殊含义。

其他一些组合

例子

解释

[abc]

方括号中间是几个字母,表示a,b,c这三个单独的字符

^abc

除了a,b,c以外的字符

[a-z]

匹配a到z之间(包括a和z)的所有单个字符

[a-zA-Z]

a到z,A到Z的所有单个字符

(a|b)

a或b

三.链接及下载

很多人找不到相对应的文档,这里大家可以注意下,例如我是qt5的,那么只需要doc.qt.io/qt-5/xxxxxxx.html,这里xxxxxxx只需要写对应的类名即可找到对应类的文档,QRegExp类使用正则表达式提供模式匹配。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020/10/20 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一.正则表达式相关函数用法
    • 1.提取数据
      • 2.修改文本
        • 3.验证文本有效性
        • 二.正则表达式
        • 三.链接及下载
        相关产品与服务
        云开发 CloudBase
        云开发(Tencent CloudBase,TCB)是腾讯云提供的云原生一体化开发环境和工具平台,为200万+企业和开发者提供高可用、自动弹性扩缩的后端云服务,可用于云端一体化开发多种端应用(小程序、公众号、Web 应用等),避免了应用开发过程中繁琐的服务器搭建及运维,开发者可以专注于业务逻辑的实现,开发门槛更低,效率更高。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档