我正在寻找一个从下面返回的Regex
The law of Huxley S有一些有趣的东西。其他有趣的事情。,达拉斯的法律,,T,,他的事情很无聊。 of void S的一些东西。
作为两行文本,其中确定了两个组:
我的目标是通过使用以下捕获组将标题从核心文本中分离出来,从而对其进行重新表述:
The law of Huxley
Something interesting. Some other interesting thing.
The law of Dallas
This thing is boring.
The law of void
Some stuff.我试过了
((The law [\w\s]+)([A-Z].+))+徒劳无功
发布于 2021-02-23 09:23:01
您可以使用
(The law\s+\w+\s\P{Lu}*)(\p{Lu}.*?)(?=The law|$)见regex演示。
详细信息
(The law\s+\w+\s\P{Lu}*) -组1:The law文本,然后是一个或多个空格、一个或多个单词字符、一个空格,然后是除大写字母以外的任何零个或多个字符。(\p{Lu}.*?) - Group 2:大写字母,然后除行中断字符以外的任何零或多个字符,尽可能少,直到随后子模式的第一次出现为止。(?=The law|$) -一种积极的前瞻性,它要求The law或字符串的结尾立即位于当前位置的右侧。https://stackoverflow.com/questions/66307090
复制相似问题