JSoup 是一个 Java 库,用于解析 HTML 文档并提取数据。它提供了一种非常直观的方式来遍历和操作 HTML 元素。要从列表中列出链接,你可以使用 JSoup 的选择器语法来查找所有的 <a>
标签,并从中提取 href
属性。
以下是一个简单的示例代码,展示了如何使用 JSoup 从一个 HTML 文档中提取所有链接:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class ListLinksExample {
public static void main(String[] args) {
// 假设这是你的HTML内容
String html = "<html><head><title>Sample Title</title></head>"
+ "<body><h1>Sample Heading</h1>"
+ "<ul><li><a href='https://example.com/page1'>Page 1</a></li>"
+ "<li><a href='https://example.com/page2'>Page 2</a></li>"
+ "<li><a href='https://example.com/page3'>Page 3</a></li></ul></body></html>";
// 解析HTML文档
Document document = Jsoup.parse(html);
// 使用选择器查找所有的<a>标签
Elements links = document.select("a[href]");
// 遍历所有的链接并打印href属性
for (Element link : links) {
System.out.println(link.attr("href"));
}
}
}
通过上述方法,你可以有效地使用 JSoup 来提取和处理 HTML 中的链接。
领取专属 10元无门槛券
手把手带您无忧上云