我正在使用groovy代码将字符串拆分成数组。我有以下字符串
string html = "<html><body><b>I like subway at\n\n</b>I like subway at\n\n";
我怎样才能得到这样的列表呢?
List splitList = ['<html>','<body>','<b>','I like subway at\n\n','</b>','I like subway at\n\n']
我使用下面的从stackoverflow引用的正则表达式-
List splittedList = html.split('(<\\/?\\w+(?:(?:\\s+\\w+(?:\\s*=\\s*(?:".*?"|\'.*?\'|[^\'">\\s]+))?)+\\s*|\\s*)\\/?>)')
这对groovy不起作用。任何帮助都将不胜感激。谢谢
发布于 2019-03-04 02:20:57
这有点令人费解,但我认为在不使用正则表达式的情况下,它可以帮助您完成大部分工作:
html = """<html><body><b>I like subway at\n\n</b>I like subway at\n\n"""
new_html= html.replace('<','@<').replace('>','>@').replace('@@','@')
print(new_html.split('@')))
输出:
['', '<html>', '<body>', '<b>', 'I like subway at\n\n', '</b>', 'I like subway at\n\n']
https://stackoverflow.com/questions/54899470
复制相似问题