jsoup解析js

Jsoup 是一个用于解析 HTML 的 Java 库，它提供了非常方便的 API 来从网页中提取和操作数据。然而，Jsoup 并不支持直接解析 JavaScript 代码。如果你需要解析和执行 JavaScript，可以考虑使用其他工具，比如 Selenium 或者 Nashorn（Java 8 引入的一个 JavaScript 引擎）。

Jsoup 解析 HTML 的基础概念

DOM（Document Object Model）：Jsoup 将 HTML 文档解析成一个 DOM 树，每个节点都是一个 Java 对象，如 Element、Node 等。

CSS 选择器：Jsoup 支持使用类似于 CSS 的选择器来查找元素，这使得提取特定数据变得非常简单。

Jsoup 的优势

简洁易用：Jsoup 提供了简洁的 API，使得解析 HTML 变得非常容易。
强大的选择器：支持 CSS 选择器，可以方便地定位到所需的元素。
数据修改：不仅可以解析 HTML，还可以修改 DOM 树并输出修改后的 HTML。
错误容忍：Jsoup 能够处理不规范的 HTML，自动修正错误。

Jsoup 的应用场景

网页爬虫：用于从网页中提取数据。
数据抓取：可以从 HTML 页面中抓取特定的信息，如新闻标题、商品价格等。
HTML 清理：可以清理不安全的 HTML，防止 XSS 攻击。

解析 JavaScript 的替代方案

如果你需要解析和执行 JavaScript，可以考虑以下方案：

Selenium

Selenium 是一个自动化测试工具，可以模拟浏览器行为，执行 JavaScript 并获取执行结果。

示例代码：

import org.openqa.selenium.WebDriver;
import org.openqa.selenium.chrome.ChromeDriver;

public class SeleniumExample {
    public static void main(String[] args) {
        // 设置 ChromeDriver 路径
        System.setProperty("webdriver.chrome.driver", "/path/to/chromedriver");

        // 创建 WebDriver 实例
        WebDriver driver = new ChromeDriver();

        // 打开网页
        driver.get("http://example.com");

        // 获取 JavaScript 执行结果
        String scriptResult = (String) driver.executeScript("return 'Hello, World!';");
        System.out.println(scriptResult);

        // 关闭浏览器
        driver.quit();
    }
}

Nashorn

Nashorn 是 Java 8 引入的一个 JavaScript 引擎，可以在 Java 程序中执行 JavaScript 代码。

示例代码：

import javax.script.ScriptEngine;
import javax.script.ScriptEngineManager;
import javax.script.ScriptException;

public class NashornExample {
    public static void main(String[] args) {
        // 获取 Nashorn 引擎
        ScriptEngine engine = new ScriptEngineManager().getEngineByName("nashorn");

        try {
            // 执行 JavaScript 代码
            Object result = engine.eval("print('Hello, World!');");
        } catch (ScriptException e) {
            e.printStackTrace();
        }
    }
}

总结

Jsoup 是一个强大的 HTML 解析库，但不支持 JavaScript 解析。如果需要解析和执行 JavaScript，可以考虑使用 Selenium 或 Nashorn 等工具。根据具体需求选择合适的工具，可以更高效地完成数据提取和处理任务。

页面内容是否对你有帮助？

有帮助

没帮助

Android -使用JSOUP解析JS生成的urls

、、、、

我试图解析由Bootstrap`s的Bootpage.js生成的url，它看起来像，但是JSOUP不能解析它并显示主url。如何从Bootpage获得正常链接，或者如何使JSOUP解析它。解析代码： Jsoup.connect("https://example.com/#page-2").followRedirects(true).get();

浏览 3提问于2016-08-25得票数 6

回答已采纳

1回答

解析Jsp文件中脚本标记(带有c标记)的问题

、、、

这对于普通的普通脚本标记来说很好(如下所示)我正在使用带有UTF-8字符集的Jsoup库解析方法将jsp文件解析为html文件。Document htmlDocument = Jsoup.parse(file, "UTF-8"); 从文档(HTML文档)中获取带有src属性的所有

浏览 0提问于2019-10-01得票数 0

1回答

在java jsoup中的html页面中搜索和查找变量值

、、、、

浏览 1提问于2012-11-27得票数 2

回答已采纳

1回答

运行Javascript函数来填充表，然后使用Jsoup解析HTML页面

、、、、

我正在为我的工作项目，允许用户解析一个给定的HTML页面，这提供了一个线索的信息。然而，我面临的问题是，网页在一个表格中显示了这个线索信息，据我所知，这个表格是从一个Javascript函数填充的，所以当Jsoup解析文档时，它找不到这个表格或它的任何内容。colspan="5"> </td> </td> </tr

浏览 1提问于2018-01-15得票数 1

2回答

如何用JSOUP在android中抓取动态页面

、、、、

我正在尝试使用JSOUP在web上刮刮网站。有没有任何方法可以搜索一个链接并加载它而不点击任何按钮并获得结果？val result:Document = Jsoup.connect(Constants.BASE_URL) .data("url", Constants.YOUTUBE_LINK

浏览 27提问于2022-07-06得票数 0

1回答

XPath转换为JSoup元素

、

我使用的是JSoup，但在将xPath转换为元素时遇到了问题。你知道为什么吗？我有点困惑。in.close(); Document doc = Jsoup.parse

浏览 0提问于2014-12-29得票数 0

2回答

JSoup:解析Twitter列表

、

我想使用解析推特列表(例如JSoup )。我的问题是，页面是动态的，也就是说，我只能从页面中得到前20个结果。有任何方法JSoup可以获取整个页面吗？目前，我的代码如下：Elements usernames = doc.select(".username.js-action-profile-name"); Elements realNames = doc.select(".ful

浏览 4提问于2015-11-22得票数 0

回答已采纳

1回答

使用JSOUP从另一个网站获取数据

、

我听说JSOUP能帮上忙。所以，我只想要些小费。(阅读用thx) 网站：

浏览 0提问于2018-10-25得票数 0

回答已采纳

1回答

是否可以使用localStorage值？

、、

在Chrome本地存储中，我看到变量(键值对)和文档内容取决于这个变量，我可以使用jsoup设置它吗？还是我应该用其他工具来做呢？

浏览 4提问于2022-04-22得票数 0

1回答

我正在使用jsoup从一个网站解析HTML。有两个选项列表是从javascript文件中的多维数组动态创建的。因为它的动态创建的jsoup不能在html中解析结果。但是，我需要的所有数据都位于JS文件中。理想情况下，我希望能够定期加载文件，并将数组数据从该文件持久化/刷新到android应用程序的本地数据库中。所讨论的JS文件是，显示列表的网站是，有没有办法下载该文件的某些方面，以便在Java中操作它，就像html中的DOM一样？

浏览 0提问于2016-09-12得票数 1

回答已采纳

1回答

如何用js解析android中的网页内容

、、

如何在Android中解析包含js结果的HTML页面？主要问题是，如果我只是使用Jsoup.connect()方法，Document对象就不会包含js结果，因为js需要一些时间来运行。

浏览 12提问于2018-01-09得票数 1

回答已采纳

1回答

在移动设备上，我可以使用WebView从html中提取数据吗？

、、

我的应用程序解析PC html页面，并根据本地UI组件呈现它们。目前，我正在开发Android，并使用Jsoup从html中提取数据。所以我想到了这个想法，用指定的平台的WebView解析html。我搜索了用例，但一无所获。将解析的数据传递给本机方法以呈现本机视图。我希望WebView解析D

浏览 1提问于2015-08-19得票数 0

回答已采纳

1回答

在使用函数的网页中导航，而不是使用Jsoup的url。

、

浏览 3提问于2019-12-29得票数 0

回答已采纳

1回答

如何使用解析xhtml文件

、

我正在使用Jsoup解析我的页面，但似乎Jsoup只是解析HTML文件。有任何方法来解析Jsoup中的XHTML文件吗？有XHTML到HTML转换器吗？org.jsoup.nodes.Document doc =org.jsoup.Jsoup.parse("http://localhost:7001/sample.xhtml"); Stri

浏览 3提问于2016-01-15得票数 0

回答已采纳

3回答

用解析https (java)

、、、

我尝试用jsoup (java)解析一个文档。import java.io.IOException;import java.net.URL; Document doc = Jsoup.parse(new URL("https://www.somesite.com/

浏览 3提问于2016-10-24得票数 0

回答已采纳

1回答

无法连接到以.tv结尾的urls

、、、

我试图解析以.tv和.mobi扩展结尾的网页，但每次尝试都会出现相同的错误。Jsoup可以很容易地解析以.com、.org、.in等结尾的网站，但不能解析.tv或.mobi。import java.io.IOException;import org.jsoup.nodes.Document;import org.jsoup</

浏览 3提问于2016-12-12得票数 0

回答已采纳

1回答

GUI与Jsoup一起走

、、

我正在使用JSoup来解析某些网页。但是，当我在后台解析页面的HTML内容时，我还希望向用户显示页面。 JSoup在超文本标记语言解析等方面非常棒，但似乎没有图形用户界面组件。插入图形用户界面组件以显示我正在用JSoup解析的网页的推荐方法是什么？

浏览 2提问于2013-11-18得票数 0

1回答

停止解析网页

、、、、

Jsoup.parse(String )停止工作。我有一个应用程序，当我使用jsoup几次来解析不同的页面时，但是当我想解析一个大页面时，jsoup就会停止，仅此而已。(Tokeniser.java:76)at org.jsoup.parser.Tokeniser.read(TreeBuilder.java:53) at org.

浏览 8提问于2011-08-12得票数 1

3回答

使用java代码获取完整的网页

、、、

我想实现一个java方法，它接受URL作为输入，并在我的磁盘上存储整个网页，包括css，图像，js (所有相关资源)。我已经使用Jsoup html解析器来获取html页面。现在，我想要实现的唯一选择是使用jsoup获取页面，然后解析html内容，将相对路径转换为绝对路径，然后对javascript、图像等发出另一个get请求，并将它们保存在磁盘上。我还读到了html清理程序，htmlunit解析器，但我认为在所有这些情况下，我都必须解析html内容来获取图像、css和

浏览 2提问于2012-04-12得票数 4

回答已采纳

1回答

从页面中解析html标签

、、、

我正在尝试解析页面(任何页面动态解析器)。请推荐我-我想从网站解析html。.*; import org.jsoup.helper.Validate;importtext/css\" href=\"style.css\" /><script src=\"http:/

浏览 2提问于2013-02-28得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

jsoup解析js

Jsoup 解析 HTML 的基础概念

Jsoup 的优势

Jsoup 的应用场景

解析 JavaScript 的替代方案

Selenium

Nashorn

总结

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐