jsoup抓取动态数据_jsoup抓取数据_使用Java和Selenium抓取完整的动态JSoup内容 - 腾讯云开发者社区

、

我想从一个特定网站的图表中抓取数据。图形中的此信息只有在我刮擦后将鼠标悬停在graph.But上时才可用，我无法看到输出中的数据，即使它在'Inspect Element‘下可见。我曾尝试使用JSoup抓取数据，但当我抓取数据时，不会显示通过鼠标悬停更改的数据。我该怎么做呢？下面是我要搜集的信息。我必须抓取动态变化的值'184‘。当您将鼠标悬停在上面一行中显示RGB值的图形上时，值184会动态变化。通过将鼠标悬停在图形上，即使这些RGB值也会发生变化。经过抓取后，Jsoup的文档输出如下所示:未显示数字184和RGB值。这些字段是如何在输出中消失的？这是不是因

浏览 1提问于2018-09-21得票数 0

2回答

如何检查网页是静态的还是动态的

、、

我正在做一些web抓取和使用Jsoup来解析html文件，我的理解是Jsoup不能很好地处理动态网页。有没有一种方法可以检查网页是否是动态的，这样我就不用费心使用Jsoup来解析它了？

浏览 0提问于2015-08-02得票数 1

1回答

在1-2秒内同时建立50+ URLConnections

、、

我试图从50+动态网页中抓取实时数据，并需要每1-2秒更新一次数据。为此，我每隔1/2秒就安排一个计时器，该计时器遍历以下方法50次(针对50个URL)： public double fetchData(String link) { String data = null; try { URL url = new URL(); urlConn = url.openConnection(link); InputStreamReader inStream = new InputStreamRead

浏览 6提问于2020-04-25得票数 0

回答已采纳

1回答

从cookiesyncmanager到https站点的Jsoup cookie身份验证

、、、、

我有一个android应用程序使用的网页视图，用户必须登录与用户名和密码，然后被重定向到页面，我想刮掉数据与jsoup。由于jsoup线程将是一个不同的会话，因此用户必须再次登录。现在，我想使用从webview收到的cookie与jsoup请求一起发送，以便能够抓取我的数据。 cookie正在与cookiesyncmanager同步，代码如下。这基本上就是我被卡住的地方，因为我不知道如何读出cookie，也不知道如何将它附加到jsoup请求中。请帮帮忙？:) public void onPageFinished(WebView view, String url) {

浏览 3提问于2012-09-13得票数 2

回答已采纳

1回答

JSOUP java.io.IOException:输入是二进制的，不受支持

、、、

我有一个项目，要求我使用JSOUP进行网络抓取。我能够从我想要刮的网站主页上得到数据。但是，当我通过循环进入超链接并访问它而在页面中更深入地抓取时，我会得到以下错误： java.io.IOException: Input is binary and unsupported at org.jsoup.UncheckedIOException.<init>(UncheckedIOException.java:11) at org.jsoup.parser.CharacterReader.<init>(CharacterReader.java:38)

浏览 9提问于2020-01-10得票数 2

2回答

如何用JSOUP在android中抓取动态页面

、、、、

我正在尝试使用JSOUP在web上刮刮网站。当我们在搜索栏中放置一个链接并单击搜索按钮时，该网站动态加载并显示一些我想要抓取的下载链接。我的问题是如何使用链接搜索加载JSOUP中的链接，而不单击search按钮并显示结果(刮取结果)。有没有任何方法可以搜索一个链接并加载它而不点击任何按钮并获得结果？我尝试了这段代码，但没有得到所需的结果。 val result:Document = Jsoup.connect(Constants.BASE_URL) .data("url", Constants.YOUTUBE_LINK)

浏览 27提问于2022-07-06得票数 0

1回答

关于抓取网站内容的建议

、、、、

我试着抓取一些网站内容，使用和java的组合。将相关详细信息保存到我的数据库中，并每天进行相同的活动。但事情是这样的，当我在浏览器中打开网站时，我得到的是html (带有所有的元素标签)。javascript部分当我测试它时，它工作得很好(我应该用它来提取正确的数据)。但是，当我使用jsoup(来自Java类)进行解析/get时，只有最初的网站被下载用于解析。这意味着有一些网站的动态部分，我想要获取这些数据，但由于它们是通过post get呈现的，在网站上异步呈现，所以我无法使用jsoup捕获这些数据。有谁知道解决这个问题的方法吗？我是否使用了正确的工具集？更有经验的人，我请求你的建议。

浏览 1提问于2012-07-02得票数 1

回答已采纳

6回答

读取JSON内容

、、

我正在使用jsoup来抓取一些HTML数据，它工作得很好。现在我需要提取一些JSON内容(只提取JSON，不提取HTML)。我能用jsoup很容易做到这一点吗?还是必须用另一种方法来做？jsoup执行的解析是对JSON数据进行编码，因此它不能使用Gson正确解析。

浏览 2提问于2011-06-15得票数 17

回答已采纳

3回答

Web抓取只有一半的时间可以使用Jsoup

、、

我最近一直在尝试使用Java Jsoup库，试图更好地理解web抓取(从网站上提取数据)。但看起来我拼凑起来的代码只在部分时间内实现了功能。是我的代码有问题，还是有可能某些站点有措施来阻止web抓取？下面是完成所有“魔术”的类： import java.io.IOException; import org.jsoup.*; import org.jsoup.nodes.Document; public class HTMLParser { private Document d; private String url; private String content; p

浏览 1提问于2011-08-11得票数 0

1回答

Java解析JS生成的html元素

、、、、

我是一个用Java解析html的新手，我以前用过JSoup来解析简单的html而不需要动态改变，但是现在我需要解析一个有动态元素的网页。这是我之前试图解析网页的代码，但是它不可能找到元素，因为它们是在页面加载后添加的。问题是一个使用谷歌地图的页面上有标记，我试图抓取这些标记的图像。 public static void main(String[] args) { try { doc = Jsoup.connect("https://pokevision.com") .userAgent( "

浏览 0提问于2016-07-25得票数 1

1回答

Selenium Chrome错误:您使用的是不受支持的命令行标志：--忽略证书错误

、、、、

好的，我正在学习Web抓取，并且对Java很满意，所以我选择了Jsoup，这是一个web抓取库。我计划抓取 (这只是一个编码问题)，但我发现很难抓取所有显示的内容，这是不可能的，因为大部分内容是动态源。因此，我使用selenium来呈现JavaScript并获得简单的HTML页面，然后将其提供给JSOUP。因此，我尝试打印呈现的HTML页面以进行验证，但在运行代码时会出现以下错误：我的守则： File f = new File("<Path to chromedriver.exe>"); System.setProperty("webdr

浏览 1提问于2018-03-03得票数 4

1回答

使用Jsoup进行抓取的更好方法

、

我开始使用JSoup today.So作为一个例子，我从这个中抓取代理开始。在玩了很多次之后，我能够抓取代理，但没有它们的端口号，因为它们正在使用JavaScript。我想知道我们是否也可以用JSoup抓取这些端口号。由于这是我的第一次尝试，我想知道我采取的方法是否正确。因此，我发布了可以获取代理的代码。 import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; import org.jsoup.safet

浏览 0提问于2012-11-01得票数 0

1回答

DataScraping在java中使用Jsoup

、、

我正在开发一个从特定站点抓取数据的java程序。我使用jSoup作为java模块。就是这个网站我正在尝试在该网站上删除下面的示例数据。 bitflyer 144 14.17% coinbase 121 11.89% 我试过这样做： public static void main(String[] args) throws IOException { try { Document doc = Jsoup.connect( "http://data.bitcoinity.org/markets/tradespm/10m?c=e&t=a&

浏览 67提问于2018-06-02得票数 -1

回答已采纳

1回答

当一个网站宕机时，会抛出哪个异常？

、、、

我正在使用jsoup从网站上抓取数据。我想知道当我从中抓取数据的网站宕机时，会抛出哪个异常。是SocketException还是NoHttpResponseException或者其他什么？我读到当服务器收到请求但没有响应时会抛出NoHttpResponseException，对吗？

浏览 1提问于2017-01-10得票数 1

1回答

如何抓取不在html源中但在浏览器中可见的数据？

、、、、

我想要的数据在浏览器中是可见的，但我无法从html源代码中找到它。我怀疑数据是由脚本生成的。我想对这样的数据进行评分。可以使用Jsoup吗？我知道Jsoup不会执行Javascript。以学院为例，我想要抓取学院和学校下的所有学院和学校。我想要获取所有学院和学校下的学院和学校。

浏览 0提问于2012-12-02得票数 0

回答已采纳

1回答

Jsoup抓取网站数据麻烦

、

对Java和Jsoup来说是全新的。我正在尝试创建一个简单的程序，它可以在web上抓取数据，并在Java中提供股票市场的数据。我想从道琼斯股票开始，让它打印52周的区间数据。它转到，查看左下角的表(从前面的close开始)，然后向下到第5个索引，然后从那里获取文本值。我知道错误：线程“主”org.jsoup.select.Selector$SelectorParseException:中的异常无法解析查询'table.W(100%)'：意外令牌在'(100%)‘ 也就是说我把桌子的课弄错了？我如何使这个代码工作？我首先从苹果( apple )的股票开始，然后在Jso

浏览 2提问于2016-11-25得票数 0

回答已采纳

1回答

抓取基于XML加载HTML的网站数据

、、

我正在尝试使用JAVA中的JSoup库从网页中抓取数据。然而，这里的问题是，我想要抓取的数据是基于XML加载的，所以当我试图从HTML解析它时，它会显示出来 <div id="report-details-container">  </div> 而不是完整的HTML，它只显示这个注释。我如何抓取数据，因为在inspect元素中我可以看到完整HTML。

浏览 0提问于2017-10-14得票数 1

1回答

在抓取网页之前更改网页上的值

、

我正在尝试使用JSoup抓取以下页面：但在浏览页面之前，我想将“过去的游戏”的值更改为5，并选择“所有玩家”而不是“顶级玩家”。我已经能够用JSoup毫无问题地抓取很多页面，但是在抓取之前，我很难找到任何关于如何更改页面上的值的信息。我做了很多谷歌搜索，但似乎没有返回我想要的东西。有没有人能告诉我如何做到这一点，或者甚至给出我正在尝试做的事情的适当术语？以下是抓取代码的要点，但我不知道如何在实际抓取之前更新页面： String URL = "https://basketballmonster.com/PlayerRankings.aspx"; try

浏览 2提问于2018-02-17得票数 1

2回答

用Jsoup初学者抓取网站

、、、、

我正在尝试使用jsoup来抓取一个网站。我使用源超文本标记语言中的".eventTableRow“类将表行提取到Elements对象中，但我不确定如何访问单个单元格。我正在尝试获取单元格中的数据，如下图中用框突出显示的数据： Elements row = doc.select(.eventTableRow); System.out.println(row); //prints similar to below image : 我不能上传图片，因为我没有10个声誉我知道对于你们中的许多人来说，这是初级的，我肯定会得到jsoup文档的链接，但我已经阅读并尝试了几个小时，就是不能让它为我

浏览 1提问于2013-06-09得票数 0

1回答

不能抓取我要找的数据？

、、、

我正在尝试从网址：* 中抓取附图中的价格和日期我成功地抓取了信息，但没有找到我想要的方式(日期+价格)。我使用了以下几行代码 import java.io.IOException; import javax.lang.model.element.Element; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; public class Test { public static void main(String[] args) { D

浏览 1提问于2016-08-13得票数 2

回答已采纳

1回答

如何在java的sql数据库中存储刮取的数据

、、、、

我必须从证券交易所网站上获取股票价格数据，并将其存储在SQL数据库中。目前，我正在通过excel进行此过程。我们在MS中获取网站的数据，然后使用宏创建.csv文件，然后通过程序在我们的.csv数据库中检索这些.csv文件的数据。现在，我该做的是首先，我想知道，是否可以将已抓取的数据存储到oracle SQL数据库中？我想创建一个java程序，它从网站上抓取数据。然后直接将其存储在oracle sql数据库中。我已经创建了一个程序，它擦拭网页，但，没有得到的价格。守则如下： package connectingurl; import java.io.*; imp

浏览 1提问于2016-04-05得票数 1

2回答

找不到Jsoup .text方法

、、

我正在尝试使用jsoup来抓取一个网站的数据，这样我就可以在Android项目中使用它。当我试图使用.text方法获取文档的所有文本时，它说“无法解决方法”，尽管我认为我导入了所有正确的东西。这是我的代码的问题还是其他原因？我的守则： Document doc = (Document) Jsoup.connect(url).get(); text = doc.text(); 编辑:找到错误，当正确的导入是org.jsoup.nodes.Document时导入了org.w3c.dom.Document

浏览 9提问于2020-06-11得票数 1

回答已采纳

2回答

如何在新的一行上打印抓取的每条信息

、

嗨，代码运行得很好，但我想知道是否有一种方法可以让它在新行上的某个点之后打印抓取的信息。对于这段代码，我希望每个公司的信息都打印在新的一行上。下面还列出了代码设置为抓取的站点。非常感谢您的帮助和阅读。 import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class WebScrape { public static void

浏览 15提问于2020-05-14得票数 1

1回答

Jsoup遍历下降和动态添加的数据

、、、

使用JSoup和Java，我希望通过在下拉列表中选择一个选项来获得动态添加的数据。一个更好地展示了我想要表达的东西的例子是。by前缀/专业下拉菜单中的每个下拉选项动态地创建一个下拉选项，该下拉选项提供所有的课程，或者一个选项，即“所有的课程”。当您选择一个课程时，它会动态地添加所有的课程信息。如果选择所有课程，则会添加该专业的所有课程数据。我可以得到所有的列表值。到目前为止这是我的密码。我只是不知道如何使用这些值来加载所有数据并遍历所有数据。 package getInfo; import java.io.IOException; import java.util.logging.Level

浏览 1提问于2015-11-20得票数 0

回答已采纳

1回答

使用JSOUP从HTML表格中提取数据

、、

因此，我目前正在尝试从(?)并将其存储。我目前的方法就是抓取网站，从中提取所有数据。然而，在看到这是多么的低效之后，我开始研究JSOUP。我设法找到了这篇关于在espn中使用JSOUP的stackoverflow文章。。我尝试过使用相同的方法，但是我不知道如何从获取所有的表信息。任何帮助都是非常感谢的！

浏览 0提问于2015-10-09得票数 0

2回答

如何使用java抓取网站而不会进入无限循环

、

我正在尝试使用java和Jsoup抓取社交媒体数据。首先，我给出了一个url并尝试抓取数据。但是它是指向无限url的，有很多子loop.In，这些子url引用了其他的基本url，这个过程就是无限url的过程。我如何才能限制网址的防止无限loop.Can任何人，请帮助我在这方面。

浏览 0提问于2015-12-22得票数 0

1回答

使用jsoup抓取<div class=“nutrition label”>中的数据

、、

我想用jsoup抓取<div class="nutrition-label">中的数据：Element element = doc.select("div.nutrition-label");元素总是空的，有什么帮助吗？该网站是方面的

浏览 0提问于2014-01-31得票数 0

1回答

在时间表内对表格进行网络抓取

、、、

我对网络抓取相当陌生，但作为我正在做的一个项目的一部分，我正在尝试从这个时间表中抓取课程的细节，我将尝试使用jsoup，但我不确定如何以只返回相关信息的方式来解析数据。任何帮助或见解都将不胜感激。

浏览 3提问于2019-01-31得票数 0

1回答

基于自定义属性的JSoup抓取

、、

所以我使用JSoup来抓取一个网站，它创建了一堆带有动态类名的div(它们改变了每个重载)，但是属性名是相同的。例如： <div class="[random text here that changes] js_resultTile" data-listing-number="[some number]"> <div class="a12_regularTile js_rollover_container " itemscope itemtype="http://schema.org/Product"

浏览 4提问于2019-09-24得票数 0

回答已采纳

3回答

如何在GWT中使用外部服务器端jar？

、、

我想在GWT服务器端代码上使用jSoup，以便能够抓取网页。GWT的文档对安装外部jars没有帮助。谁能告诉我如何在jSoup中安装GWT (从官方jSoup站点下载)并在服务器端代码中使用它？

浏览 1提问于2013-01-09得票数 5

回答已采纳

1回答

Android Java JSoup搜索然后检索结果

、、、

我正在使用JSoup从url抓取/解析数据，但我需要能够也能够在网页上填写开始日期和结束日期字段。在这个问题上任何帮助都将不胜感激，谢谢

浏览 21提问于2019-09-30得票数 1

回答已采纳

1回答

如何基于data-stat从表中获取1个元素

、

页面网址：表位置：<tr id="per_game.2019 class="full_table"> 元素我想要：<td class="right" data-stat="fg3a_per_g">2.5</td> 2.5是我想要的。我过去常常抓取整个表，然后循环到这些信息，但是我发现这比试图根据数据-stat名称抓取更多的工作。但到目前为止我还是失败了问题是:是否可以基于数据统计部分来获取信息？代码： public static void getDataTest(String url) throw

浏览 0提问于2019-03-19得票数 0

回答已采纳

3回答

基于虚拟专用网/代理的JSoup

、、、、

我正在尝试使用JSoup抓取临时服务器上的一些页面。要使用浏览器查看临时服务器上的页面，我需要连接到VPN。我已连接到VPN，但当我使用JSoup尝试抓取页面时，它总是超时。如何使我的程序使用VPN连接。或者这里还有什么我没想到的吗？注意:我还在程序的另一部分中使用了HttpClient。有没有一种方法可以设置我的程序在程序初始化后连接到VPN/Proxy，以便JSoup和HttpClient都使用VPN/Proxy。谢谢

浏览 6提问于2012-11-08得票数 5

回答已采纳

1回答

网站登录并保留会话cookie

、、、

我试图从网站上抓取一些内容，但您必须登录才能查看特定内容。我想使用用户id和密码进行登录，并将会话cookie保存在: m.amway.com上，我尝试使用Jsoup...然而，在使用下面的代码后，我意识到Jsoup无法读取网站所基于的javascript……有没有人有方法可以用来登录、保存会话cookie和抓取内容，使用的不是Jsoup？提前谢谢。 public String Jlogin(String User, String Pass) throws Exception{ String title = "didnt work"; Respons

浏览 0提问于2012-10-27得票数 0

回答已采纳

1回答

如何让Jsoup获取桌面版本的URL

、、、、

我试图在安卓应用程序中使用JSoup从网页中抓取他们的元数据，但最终还是下载了网站的手机版本。有没有办法让网站相信请求来自桌面客户端？

浏览 1提问于2017-03-29得票数 2

1回答

获取网站移动版？

、、

目前，我正在获取一个网站只是通过它的正常地址 Jsoup.connect(url).get(); 但我想知道我是否可以通过伪造到一个例如移动版本的抓取来优化网络数据？这有可能吗？

浏览 1提问于2012-05-17得票数 2

回答已采纳

1回答

正在从网站获取实时数据...喝汤吗？OCR？

、、、、

我需要从博彩网站获得一些实时足球统计数据-使用java。我的第一个想法是使用Jsoup，但似乎没有给我任何输出。我做错了什么吗？这是我想要抓取的网页类型吗？如果是这样，我是否可以使用OCR来获取所需的统计数据？ Document doc = Jsoup.connect("https://www.betfair.com/sport/football/event?eventId=27446056").get(); String shots = doc.select("#in-game-stats > div:nth-child(1) > div.si-hom

浏览 1提问于2015-05-26得票数 1

1回答

Spring有没有Web抓取的解决方案？

、、

我需要建立一个网络应用程序，这将抓取和爬行一些网站，并提取数据和爬虫将有调度器。我知道有很多工具可以解析和提取数据，比如Jsoup，但我只想知道我是否可以用Spring工具实现这一点？

浏览 0提问于2017-02-24得票数 4

1回答

Jsoup网络抓取给我的java.lang.NoClassDefFoundError指向我声明我的文档的那行，我不确定为什么？

、、

下面我有一些Jsoup代码，我只是试图从coinbase中建立抓取，但由于某种原因，它抛出了标题中的错误，有人知道我做错了什么吗？ import java.io.IOException; import org.jsoup.*; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; public class Main { public static void main(String[] args) { try { Document doc = J

浏览 1提问于2020-11-01得票数 0

1回答

JSoup:访问多个HTML类中的数据

、

我最近开始使用JSoup来抓取HTML数据，但是我在jsoup.org上找不到关于如何找到嵌套在其他div类中的div类的详细信息。 <div class="Food"> <a href="/eating/101" class="Eating"> <div class="Groceries"> <div class="Vegtables"> <div class="LeafyGreens"

浏览 3提问于2018-03-12得票数 0

1回答

使用Jsoup从HTML中获取多个表

、、

我试图从这个网站上的多个表中抓取数据：我需要将表数据和它们各自位于h2中的日期放在一起，所以我想要这样做：查找第一次约会头h2 在h2下面提取表数据(可以是多个表) 移到下一个标头和提取表等。我编写了独立提取所有部分的代码，但我不知道如何提取数据，使其与相关的日期头保持一致。如有任何帮助或指导，将不胜感激。下面是我开始的代码，但是就像我说的，它所做的只是迭代数据。 import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup

浏览 2提问于2014-07-03得票数 1

回答已采纳

1回答

Java Jsoup Print For Loop

、、、、

我对Java和Jsoup都是新手。我已经成功地用Jsoup抓取了网站数据。然而，目前我正在打印搜索结果的标题，它们都在一行中返回。我想将结果嵌套在一个for循环中，这样搜索标题结果就会打印在一行上。 This is how the website is formatted: <ul> <li><span class ="title">Title 1<span></li> <li><span class ="title">Title 2<span></li>

浏览 24提问于2019-11-08得票数 0

1回答

使用Java和Selenium抓取完整的动态JSoup内容

、、、

我正在试着抓取这个网站 https://www.dailystrength.org/search?query=aspirin&type=discussion 为我的一个项目获取一个数据集(使用阿司匹林作为占位符搜索项目)。我已经决定用Jsoup来做一个爬虫。但问题是，帖子是通过Ajax请求动态带来的。使用显示更多按钮发出请求 This button causes the problems 当显示整个内容时，它应该看起来像这样，并带有文本“所有消息已加载”。 end result import java.io.IOException; import java.util.ArrayLi

浏览 34提问于2019-02-03得票数 0

回答已采纳

1回答

如何为目前播放歌曲的电台网站刮刮？

、、、

我正在制作一个节目，使用jsoup为当前正在播放的歌曲和艺术家抓取一个特定的广播网站。我遵循了本教程：，但无法从网站获得正确的数据。我想访问这个电台网站：和显示歌曲(和艺术家)，这是目前正在播放。到目前为止，这是我的代码： package jsoupTest; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; import java.io.IOException; public class

浏览 0提问于2018-04-06得票数 0

回答已采纳

2回答

使用JSoup抓取数据？

、、

我想从这个网站上获取数据与网络抓取。我以前在更多的静态超文本标记语言站点中使用过JSoup，但这一次对我来说很困难，因为在我获得超文本标记语言之前，站点上的表格必须单击一个按钮，而且我不知道是否可以使用JSoup来操纵按钮。单击此按钮后，我将获得一个HTML表。那么我如何才能做到这一点呢？提前感谢

浏览 3提问于2014-04-02得票数 0

3回答

如何使用Jsoup获取表的h2标签

、、、

我需要一些帮助，用Jsoup抓取一个网页。我想从hcfactions网页上分析球员的资料，并收集他们的死亡和死亡人数。我遇到的问题是，每个个人资料页面都是动态创建的，只有在玩家有死亡或死亡的情况下才会有表。因此，为了知道我正在解析的是哪个表，我需要获取在调用之后设置的头文本。示例网页：。下面是我正在抓取的网页中的一段html： <table class='table-bordered'><h2 style='text-align:center'>Deaths</h2> <tr><td>Dat

浏览 1提问于2012-12-22得票数 0

4回答

外部库是否会使应用程序变慢？

、、、

我正在构建一个从网页上抓取信息的应用程序。为此，我选择使用名为的html刮板，因为它使用起来非常简单。Jsoup也依赖于Apache Commons Lang libray。(它们加起来总共有385kB )。因此，Jsoup将用于下载页面并对其进行解析。我的问题是，使用这些简化库，而不是使用Androids内置库，是否会使我的应用程序变慢？(在下载数据和解析方面)。我在想，内部库应该针对Android进行优化。

浏览 14提问于2010-08-11得票数 5

回答已采纳

1回答

使用Android进行简单的HTML解析？

、、、、

我有一个简单的网页，我想抓取与安卓应用程序。想知道有什么推荐吗？SAX、DOM还是Jsoup？我正在处理的HTML只有16K的数据，所以我更喜欢最轻量级的解决方案。

浏览 0提问于2013-03-30得票数 0

回答已采纳

3回答

用JSoup进行屏幕抓取

、、

我想从这个网站获得数据与网络抓取。我以前使用过JSoup来处理更多的静态HTML站点，但是这个比较困难，因为在我获得站点上的HTML表之前，必须单击一个按钮，而且我不知道是否可以使用JSoup来操作该按钮。单击此按钮后，我将得到一个HTML表，我只想在模态为Barge的地方获取数据。谢谢您使用Firefox的贴士，现在我有了另一个页面信息的表。你能告诉我怎么才能只得到桌子的信息吗？我得到的输出如下：

浏览 1提问于2013-12-13得票数 3

回答已采纳

1回答

不是所有元素都被刮掉吗？

、、

jsoup 当从有200个元素的网站抓取数据时，输出只有200个元素中的前49个或50个元素，为什么？-我如何解决这个问题。要获取所有200个元素的数据? Document d = Jsoup.connect("https://www.ebay.com/sch/i.html?_from=R40&_trksid=p2047675.m570.l1313.TR0.TRC0.H0.Xsilver.TRS0&_nkw=silver&_sacat=0").timeout(6000).get(); Elements ele = d.select("div#Re

浏览 12提问于2017-06-30得票数 0

回答已采纳