首页
学习
活动
专区
工具
TVP
发布

Hadoop数据仓库

专栏作者
512
文章
708558
阅读量
108
订阅数
精通正则表达式 - 打造高效正则表达式
        总的来说,提高正则表达式效率的关键在于彻底理解回溯背后的过程,掌握技巧来避免可能的回溯。
用户1148526
2023-10-14
4640
精通正则表达式 - 正则表达式实用技巧
        希望匹配连续多行文本,常见的情况是,一个逻辑行(logical line)可以分为许多现实的行,每一行以反斜杠结尾。
用户1148526
2023-10-14
5100
正则表达式必知必会 - 常见问题的正则表达式解决方案
        与正则表达式有关的问题很少会有什么终极答案。更常见的情况是取决于对不确定性的容忍程度。同时存在着多种解决方法,在正则表达式性能与其所能够处理的场景之间总是存在着权衡。记住,不仅要匹配符合条件的号码,还要排除不符合条件的号码,这也是该正则表达式看起来比较复杂的原因。
用户1148526
2023-10-14
2790
正则表达式必知必会 - 嵌入式条件
        (123)456-7890 和 123-456-7890 都是可接受的北美电话号码格式,而 1234567890、(123)-456-7890 和 (123-456-7890) 虽然都包含数目正确的数字字符,但格式都不对。如果要编写一个只匹配可接受格式的正则表达式,下面是最容易想到的解决方案。
用户1148526
2023-10-14
1340
正则表达式必知必会 - 环视
        还是先来看一个例子:要把一个 Web 页面的页面标题提取出来。HTML 页面标题是出现在 <title> 和 </title> 标签之间的文字,而这对标签又必须位于 HTML 代码的 <head> 部分里。
用户1148526
2023-10-14
2330
正则表达式必知必会 - 反向引用
        要想理解为什么需要反向引用,最好的方法是看一个例子。HTML 程序员使用标题标签 <h1> 到 <h6>,以及配对的结束标签来定义和排版 Web 页面里的标题文字。假设现在需要把某个 Web 页面里的所有标题文字全都查找出来,不管是几级标题。
用户1148526
2023-10-14
2650
正则表达式必知必会 - 使用子表达式
        假设需要找出所有重复的 HTML 不间断空格,将其用其他内容替换。
用户1148526
2023-10-14
1630
正则表达式必知必会 - 位置匹配
        位置匹配用于指定应该在文本中什么地方进行匹配操作,先来看一个例子。
用户1148526
2023-10-14
1360
正则表达式必知必会 - 重复匹配
        要想匹配某个字符(或字符集合)的一次或多次重复,只要简单地在其后面加上一个 + 字符就行了。+ 匹配一个或多个字符(至少一个;不匹配零个字符的情况)。比如,a 匹配 a 本身,a+ 匹配一个或多个连续出现的 a。类似地,[0-9] 匹配任意单个数字,[0-9]+ 匹配一个或多个连续的数字。
用户1148526
2023-10-14
4610
正则表达式必知必会 - 使用元字符
        元字符是一些在正则表达式里有着特殊含义的字符。英文句号 . 是一个元字符,它可以用来匹配任意单个字符。类似地,左方括号 [ 也是一个元字符,它标志着一个字符集合的开始。因为元字符在正则表达式里有着特殊的含义,所以这些字符就无法用来代表它们本身。例如不能使用 [ 来匹配 [ 本身,也不能使用 . 来匹配 . 本身。来看一个例子,用一个正则表达式去匹配一个包含 [ 和 ] 字符的 JavaScript 数组。
用户1148526
2023-10-14
1840
正则表达式必知必会 - 匹配一组字符
        这里使用的正则表达式以 [ns] 开头,这个集合将匹配字符 n 或 s。[ 和 ] 不匹配任何字符,它们只负责定义一个字符集合。接下来,正则表达式里的普通字符 a 匹配字符 a ,. 匹配一个任意字符,\\. 匹配 . 字符本身,普通字符 xls 匹配字符串 xls。从结果上看,这个模式只匹配了 3 个文件名,与预期一致。
用户1148526
2023-10-14
1490
正则表达式必知必会 - 匹配单个字符
        my 也是静态文本,它在原始文本里找到了两个匹配结果,出现位置分别是第 8 个字符开始和第 37 个字符开始。
用户1148526
2023-10-14
2230
正则表达式必知必会 - 入门
        正则表达式的用途不外乎两种情况:一种是查找特定的信息,另一种是查找并编辑特定的信息,从根本上来讲就是搜索和替换。给定一个正则表达式,它要么匹配一些文本(进行一次搜索),要么匹配并替换一些文本(进行一次替换)。
用户1148526
2023-10-14
1770
MySQL 正则表达式 - regexp_count、regexp_extract
        在学习 MySQL 正则表达式时可能会发现,有些常用功能并未提供。最典型的两个是:返回匹配项数目;一次返回所有匹配项。但我们可以创建自定义函数,在其中使用递归查询来实现。
用户1148526
2023-10-14
2930
MySQL 正则表达式 - 自带函数
        MySQL 使用 International Components for Unicode(ICU)实现正则表达式,该组件提供了完整的 Unicode 支持,并且是多字节安全的。在 MySQL 8.0.4 之前,MySQL 使用 Henry Spencer 的正则表达式实现,该实现以字节方式运行,不安全。
用户1148526
2023-10-14
2890
学习正则表达式 - 提取和替换 XML 标签
        使用 lorem.dita 作为示例 XML 文档,通过正则表达式提取出该文档中的所有 XML 标签,并转换为简单的 XSLT 样式表。可以在 Github 中找到 lorem.dita 文件,地址是https://github.com/michaeljamesfitzgerald/Introducing-Regular-Expressions。为了节省篇幅,节选部分文本作为测试数据。
用户1148526
2023-10-14
3900
学习正则表达式 - 用 HTML 标记文本
        使用 rime.txt 中柯勒律治的诗文作为示例文本,通过正则表达式为普通文本添加 HTML5 标签。可以在 Github 中找到 rime.txt 文件,地址是https://github.com/michaeljamesfitzgerald/Introducing-Regular-Expressions。为了节省篇幅,节选部分文本作为测试数据。
用户1148526
2023-10-14
1320
学习正则表达式 - 环视
        环视是一种非捕获分组,它根据某个模式之前或之后的内容匹配其他模式。环视也称为零宽断言,匹配条件不会出现在匹配结果中。环视包括:正前瞻;反前瞻;正后顾;反后顾。
用户1148526
2023-10-14
1410
学习正则表达式 - 量词
        {m,n} 是通用形式的量词,正则表达式还有三个常用量词,分别是 +、?、*。它们的形态虽然不同于 {m,n},功能却是相同的,因此也可以把它们理解为“量词简记法”。具体说明见下表。
用户1148526
2023-10-14
1360
正则表达式 - 匹配 Unicode 和其他字符
      有时我们需要匹配 ASCII 范围之外的字符。现在已经有了可以表示超过10万个字符的Unicode 标准(http://www.unicode.org)。然而,Unicode 也没有完全舍
用户1148526
2023-05-11
2.5K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档