首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >解析代号为One的HTML页面的最佳方法是什么?

解析代号为One的HTML页面的最佳方法是什么?
EN

Stack Overflow用户
提问于 2017-02-02 19:19:47
回答 1查看 57关注 0票数 1

我想解析HTML,以便从没有可用服务的网页中读取信息。

对于JavaSE,我可能会使用jsoup和HTML sanitizer来使其格式良好,并在将中间格式处理为可扩展标记语言之前过滤掉不相关的部分。

但是,使用代号为One的任意库并不那么简单,因为运行时没有JavaSE的完整作用域。

有人用Codename One做过HTML解析吗?最好的方法是什么?

EN

回答 1

Stack Overflow用户

发布于 2017-02-03 14:45:57

代号为One的内置XMLParser即使格式为SGML (格式错误的XML)也可以解析。它应该产生足够好的结果。

或者,您可以使用BrowserComponent来加载带有JavaScript的超文本标记语言,并使用DOM查询来解析数据,我认为这甚至有可能在不显示组件的情况下实现,但我不是100%确定。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42000856

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档