用于HTML到文本转换的开源java库

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (2)
  • 关注 (0)
  • 查看 (10)

你能否推荐一个将HTML转换为文本的开源Java库(最好是ASL / BSD / LGPL许可证)- 清理所有标签,转换实体(&等等)并正确处理<br>和表格。

更多信息

我把HTML作为一个字符串,不需要从网上获取它。另外,我正在寻找的是这样的方法:

String convertHtmlToPlainText(String html)
提问于
用户回答回答于

TextExtractor类听起来像它会做你想要什么。对不起,不能发布第二个链接,因为我是新用户,但向下滚动主页并且有链接。

用户回答回答于

扫码关注云+社区