当我的字符串是这个正则表达式的aaaABccc结果时,我有一个正则表达式:(.*)(A|B|AB)(.*)
:
Full match 0-8 aaaABccc Group 1. 0-4 aaaA Group 2. 4-5 B Group 3. 5-8 ccc
问题:我想要匹配如下结果:
Full match 0-8 aaaABccc Group 1. 0-4 aaa Group 2. 4-5 AB Group 3. 5-8 ccc
我如何改变我的正则表达式来做这件事?请帮帮我,谢谢!
发布于 2020-03-10 15:04:39
你的问题不仅与优先级有关,而且第一组是贪婪的。它试图尽可能地长。因此,调整到这一点将会起作用(即使使用您的替代方案):
(.*?)(AB|A|B)(.*)
?
将量词转换为非贪婪版本:.*
(任意字符,贪婪)变为.*?
(任意字符,非贪婪)
发布于 2020-03-10 14:58:01
您可以使用以下正则表达式:
(.*)(AB)(.*)
发布于 2020-03-10 15:25:51
这真的取决于你使用的数据集,也许你可以给我们更多关于它的信息。但现在看起来我们可以使用前缀和后缀都是小写字符的事实:
\b([a-z]*)(A|B|AB)([a-z]*)\b
https://regex101.com/r/wQFtt9/2
如果你需要的话,我们可以推广更多。如果A或B不能出现在第一部分或最后一部分中,则使用this。[^AB\n]
表示计算除A、B或换行符以外的所有内容(如果您有多行数据集,则必须使用带换行符的部分)。
\b([^AB\n]*)(A|B|AB)([^AB\n]*)\b
https://stackoverflow.com/questions/60612519
复制相似问题