首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >收集重复的2组模式。

收集重复的2组模式。
EN

Stack Overflow用户
提问于 2021-02-21 21:02:59
回答 1查看 55关注 0票数 2

我正在寻找一个从下面返回的Regex

The law of Huxley S有一些有趣的东西。其他有趣的事情。,达拉斯的法律,T,,他的事情很无聊。 of void S的一些东西。

作为两行文本,其中确定了两个组:

  1. 第一组,以“法律”开头,以第一个大写字母结尾;
  2. 第二组开始后,当遇到下一组“规律”模式时结束。

我的目标是通过使用以下捕获组将标题从核心文本中分离出来,从而对其进行重新表述:

代码语言:javascript
复制
The law of Huxley 
Something interesting. Some other interesting thing. 

The law of Dallas 
This thing is boring.

The law of void
Some stuff.

我试过了

代码语言:javascript
复制
((The law [\w\s]+)([A-Z].+))+

徒劳无功

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-02-23 09:23:01

您可以使用

代码语言:javascript
复制
(The law\s+\w+\s\P{Lu}*)(\p{Lu}.*?)(?=The law|$)

regex演示

详细信息

  • (The law\s+\w+\s\P{Lu}*) -组1:The law文本,然后是一个或多个空格、一个或多个单词字符、一个空格,然后是除大写字母以外的任何零个或多个字符。
  • (\p{Lu}.*?) - Group 2:大写字母,然后除行中断字符以外的任何零或多个字符,尽可能少,直到随后子模式的第一次出现为止。
  • (?=The law|$) -一种积极的前瞻性,它要求The law或字符串的结尾立即位于当前位置的右侧。
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66307090

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档