你能推荐一个开源的Java库(最好是ASL/BSD/LGPL许可证),它可以将HTML转换为纯文本-清理所有标签,转换实体(&,*,等等)以及正确的句柄和表格。
更多信息
我有一个字符串形式的HTML,没有必要从web上获取它。另外,我正在寻找的是这样的方法:
String convertHtmlToPlainText(String html)
https://stackoverflow.com/questions/1518675
相似问题