我不熟悉正则表达式,我正在尝试编写一个(Python风格的),它允许我在每个标点符号或空格处拆分,除了单个连字符(例如,9-5,Mon-Fri不会被拆分)。但是,我要处理的文本有时包含一系列连字符,如-------------,用于分隔文档的段落或主题不同的部分。因此,我想要一个解决方案,在除连字符之外的每个标点符号的一个或多个匹配项上拆分,并在2个或更多个连字符的组合上拆分。
我已经尝试使用以下代码:
re.split(r"[-{2,}\.,:\s]", mystring)但是-{2,}部分是逐字解释的。我也尝试将其合并到一个组中,但同样,括号是按字面解释的。我知道我可以编写第一个正则表达式来用空字符替换多个连字符,并编写第二个正则表达式来查看所有其他空格和标点符号;然而,我想知道是否有一种方法可以在一个步骤中做到这一点。
发布于 2021-11-19 15:49:37
https://stackoverflow.com/questions/70037391
复制相似问题