我想解析HTML,以便从没有可用服务的网页中读取信息。
对于JavaSE,我可能会使用jsoup和HTML sanitizer来使其格式良好,并在将中间格式处理为可扩展标记语言之前过滤掉不相关的部分。
但是,使用代号为One的任意库并不那么简单,因为运行时没有JavaSE的完整作用域。
有人用Codename One做过HTML解析吗?最好的方法是什么?
发布于 2017-02-03 14:45:57
代号为One的内置XMLParser即使格式为SGML (格式错误的XML)也可以解析。它应该产生足够好的结果。
或者,您可以使用BrowserComponent来加载带有JavaScript的超文本标记语言,并使用DOM查询来解析数据,我认为这甚至有可能在不显示组件的情况下实现,但我不是100%确定。
https://stackoverflow.com/questions/42000856
复制相似问题