首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >Groovy使用标签拆分html并创建列表

Groovy使用标签拆分html并创建列表
EN

Stack Overflow用户
提问于 2019-02-27 06:39:26
回答 1查看 245关注 0票数 0

我正在使用groovy代码将字符串拆分成数组。我有以下字符串

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
string html = "<html><body><b>I like subway at\n\n</b>I like subway at\n\n";

我怎样才能得到这样的列表呢?

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
List splitList = ['<html>','<body>','<b>','I like subway at\n\n','</b>','I like subway at\n\n']

我使用下面的从stackoverflow引用的正则表达式-

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
List splittedList = html.split('(<\\/?\\w+(?:(?:\\s+\\w+(?:\\s*=\\s*(?:".*?"|\'.*?\'|[^\'">\\s]+))?)+\\s*|\\s*)\\/?>)')

这对groovy不起作用。任何帮助都将不胜感激。谢谢

EN

回答 1

Stack Overflow用户

发布于 2019-03-04 02:20:57

这有点令人费解,但我认为在不使用正则表达式的情况下,它可以帮助您完成大部分工作:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
html = """<html><body><b>I like subway at\n\n</b>I like subway at\n\n"""
new_html= html.replace('<','@<').replace('>','>@').replace('@@','@')
print(new_html.split('@')))

输出:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
['', '<html>', '<body>', '<b>', 'I like subway at\n\n', '</b>', 'I like subway at\n\n']
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54899470

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文