下面是解释这一点的最简单的方法。下面是我使用的代码:
re.split('\W', 'foo/bar spam\neggs')
-> ['foo', 'bar', 'spam', 'eggs']这是我想要的:
someMethod('\W', 'foo/bar spam\neggs')
-> ['foo', '/', 'bar', ' ', 'spam', '\n', 'eggs']原因是我想将字符串拆分成标记,对其进行操作,然后将其重新组合在一起。
发布于 2010-01-26 07:45:20
>>> re.split('(\W)', 'foo/bar spam\neggs')
['foo', '/', 'bar', ' ', 'spam', '\n', 'eggs']发布于 2016-05-18 03:20:51
如果要在换行处拆分,请使用`splitlines(True)`..。
>>> 'line 1\nline 2\nline without newline'.splitlines(True)
['line 1\n', 'line 2\n', 'line without newline'](不是一个通用的解决方案,但是在这里添加这个,以防有人在这里没有意识到这个方法的存在。)
发布于 2018-05-29 12:05:32
另一个示例,拆分非字母数字并保留分隔符
import re
a = "foo,bar@candy*ice%cream"
re.split('([^a-zA-Z0-9])',a)输出:
['foo', ',', 'bar', '@', 'candy', '*', 'ice', '%', 'cream']解释
re.split('([^a-zA-Z0-9])',a)
() <- keep the separators
[] <- match everything in between
^a-zA-Z0-9 <-except alphabets, upper/lower and numbers.https://stackoverflow.com/questions/2136556
复制相似问题