我将通过jsoup连接到一个url,并获得它的所有内容,但问题是如果我选择like,
doc.select("body")
它返回单个元素,但我希望获取页面中的所有元素并逐个迭代它们,例如,
<html>
<head><title>Test</title></head>
<body>
<p>Hello All</p>
<a href="test.html">Second Page</a>
<div>Test</div>
</body>
</html>
如果我选择使用body,我将在一行中得到结果,例如,
Test Hello All Second Page Test
相反,我希望选择所有元素并逐个迭代,并产生如下结果:
Test
Hello All
Second Page
Test
使用jsoup可以做到这点吗?
谢谢,
卡尔蒂克
发布于 2011-08-12 20:18:34
您可以使用*
选择器选择文档的所有元素,然后使用Element#ownText()
分别获取每个元素的文本。
Elements elements = document.body().select("*");
for (Element element : elements) {
System.out.println(element.ownText());
}
发布于 2014-10-20 22:31:23
使用jsoup库获取文档体中的所有元素。
doc.body().children().select("*");
只获取文档体元素中的第一级元素。
doc.body().children();
发布于 2011-08-12 18:05:39
https://stackoverflow.com/questions/7036332
复制相似问题