我有一些可以进行文本替换的python代码。下面是一个例子:
regex.sub(r"\bPhrensy", r"Frenzy", xhtml) # Phrensy -> Frenzy
regex.sub(r"\bphrensy", r"frenzy", xhtml) # phrensy -> frenzy因为输入可以有两种大小写作为单词的开头,所以我们为两个替换项都有两行。如果我能用([Pp])的捕获组将它压缩到一行就好了,但是替换的总是一个案例。
我已经阅读了backreference docs以查看此功能是否存在,但我什么也看不到。它可能不在语言中,但只是以防万一:我在Python3中的反向引用替换中是否缺少大小写匹配?
理想情况下,大小写匹配也应该是Unicode大小写感知的,但如果它只适用于ASCII,这是可以接受的。
发布于 2020-09-17 01:31:19
没有这样的功能,替换后向引用总是包含捕获到相应组中的确切文本。
您可以做的是评估匹配,并在替换时应用自定义逻辑:
import re
text = "phrensy likes me. Phrensy doesn't."
print ( re.sub(r"\b([Pp])hrensy", lambda x: ("F" if x.group(1).isupper() else "f") + r"renzy", text) )
# => frenzy likes me. Frenzy doesn't.请参阅Python demo
https://stackoverflow.com/questions/63924804
复制相似问题