抓取-无法从h3中提取数据_使用python从div中抓取h3_抓取:无法从网页中提取内容 - 腾讯云开发者社区

、、、、

我开始使用Scrapy，并设法提取了一些我需要的数据。然而，并不是所有的东西都是正确的。我正在应用here官方教程中的知识，但它不起作用。

浏览 10提问于2021-02-09得票数 0

回答已采纳

2回答

美汤解析多个标签

、、

我正在为我的学校评分系统处理数据，我试图弄清楚如何按类别提取数据。Types of Reactions Lab8/26/2019 10/10但是，我想将这些内容按照HTML中的类别进行分类如果我用h3而不是td运行相同的脚本，我会得到它们：Formative QuizzesLab Assessments 所以我

浏览 0提问于2019-09-09得票数 0

1回答

我怎么知道坐标(x，y，z)

、、、

我是新来的侏儒。对于2D图，在左边底部有坐标(x，y)，但我想知道。我浪费时间去寻找答案，但我还是找不到。

浏览 6提问于2013-10-10得票数 0

回答已采纳

2回答

如何在python漂亮汤中抓取交替的子标记

、、

我试图从html页面中的交替标记中获取一系列数据。html如下所示： <h3>title</h3> <h3>title</h3> ...</div> 既然我不能在“div

浏览 6提问于2014-11-28得票数 0

回答已采纳

1回答

谷歌能抓取.TS (MPEG2 2-TS)视频格式吗？

、、、、

但是，Google只能爬行到以下格式：谷歌可以抓取以下视频文件类型：.3g2、.3gp2、.3gp、.3gpp、.asf、.avi、.divx、.f4v、.flv、.m2v、.m3u8、.m4v、.mkv

浏览 0提问于2018-11-29得票数 1

回答已采纳

1回答

通过知道R中的CSS类来抓取嵌入式交互式地图的详细信息

、、、

我打算在这个中从地图中抓取数据首先我抓取了地图中所有标记的所有经度，但我无法捕捉到标记的其他信息。在对此网页的检查中，我发现所需数据的类是"infodetail“，如下图所示：因此，我使用rvest提取数据，如下所示： webhtml <- read_html(webpage) webnod这个类是否从所有标记中提取信息？

浏览 1提问于2018-05-22得票数 0

2回答

使用RVEST对<dl> <dt> <dd> html标记进行网络抓取

、、、

我正在尝试使用rvest从二手车广告中提取一些数据。但是，我无法使用html_nodes()函数抓取构成< dl >、< dt >或< dd > html标记的数据。更具体地说，我想在下面的数据框中抓取下面汽车广告的图像中的特征。谢谢!阿恩

浏览 2提问于2020-05-07得票数 0

1回答

BeautifulSoup使用循环从多个div抓取信息到JSON

、、

我是刮标题，描述，链接，和人的名字从多个div遵循相同的结构。我正在使用BeautifulSoup，并且能够从第一个div中抓取所有东西。但是，我在从长长的div列表中抓取数据和以可移植格式(如CSV或JSON )获取数据时遇到了困难。<div class=&quo

浏览 1提问于2016-03-22得票数 2

回答已采纳

1回答

Scrapy不跟随提取的链接

、、、

Scrapy不遵循抓取的链接。当我调用这个函数时，它应该从之前抓取的链接中提取详细信息，但它不起作用，而是从start_urls中抓取内容。def parse_indetail(self, response): item['price'] = response.xpath('//h3

浏览 2提问于2021-04-17得票数 0

2回答

Webscraping BS4问题不返回数据

、、

我是新来的，已经阅读了许多历史帖子，但无法确切地找到我正在寻找的东西。 title = sp.find_all(&

浏览 2提问于2022-07-01得票数 0

回答已采纳

1回答

循环从<div>标记中的多个标记中提取文本，该标记具有漂亮的Soup解析

、、

我正在尝试运行一个循环，在一个web抓取脚本，使用美丽的汤提取数据从这个。循环将遍历每个div标记并提取4条不同的信息。它搜索一个h3、一个div和2个span标记。但是，当我添加".text“选项时，我会从'date‘、'soldprice’和'shippingprice.‘’中得到错误。错误说： AttributeError: 'NoneType' object has no attribute '

浏览 0提问于2021-06-02得票数 0

回答已采纳

1回答

用Python抓取Web应用程序

、

到目前为止，我在网络抓取方面的大部分经验都是非常简单和容易理解的。发送请求，下载HTML，并提取所需的信息。目前，我对从Spotify Web应用程序中抓取顶级游戏数据感兴趣。这些数据无法通过API访问，但在浏览不同的艺术家页面时可以看到。我的问题是，这些数据是如何在幕后生成的，是否有可能抓取这些数据？

浏览 5提问于2015-02-09得票数 2

1回答

使用UiPath从图像中提取文本

我一直在尝试使用UiPath从图像中提取数据。我尝试过citrix自动化，但没有任何输出。我也尝试过屏幕抓取，但精度达不到mark.Also，我无法提取以表格形式呈现的数据(在图像中)。

浏览 17提问于2018-02-06得票数 0

1回答

R和RSelenium抓取javascript表

、

我正在尝试使用R和Selenium从Fangraphs中抓取棒球数据。不幸的是，我想使用的图表是javascript，并且图表的备份数据是公开不可用的(或者我无法使用inspect找到它)。我正在尝试使用Selenium来抓取这些数据，但对代码并不熟悉。如果我能提供更多的信息，请告诉我。我真诚地感谢所有的帮助。

浏览 3提问于2017-02-06得票数 1

回答已采纳

1回答

Excel VBA web自表抓取

、、、、

我试图从下面的表格中提取一些信息到Excel中，使用VBL，但没有成功。我需要的值似乎没有分配给它的任何元素ID、标记名或类名。我的目标是燃油使用值(89218)和同一行的时间值(01:15)。在如何从表中抓取值或如何从特定的TR、TD提取数据方面，任何人都能指出正确的方向吗？表的HTML源：

浏览 5提问于2016-12-26得票数 3

1回答

使用XPATH进行web抓取并不顺利

、、、

我试着用python在网上抓取。我是新来的。我想从一个表中提取数据。我正在使用来自xPath助手的帮助，但是当它变成代码时，它似乎无法工作。sample-network-traffic"]/h2/text()') dns1 = tree.xpath('//section[@id="sample-network-traffic"]/div[@id="dns-requests"]/h3</e

浏览 6提问于2021-01-13得票数 0

回答已采纳

2回答

为什么我在抓取html页面时不能返回一个数字？

、、、、

我正在尝试从页面中提取24小时的卷。他们有一个，但似乎json数据中没有返回卷(至少我无法让它工作)。我尝试过使用regex进行简单的抓取，现在正在使用lxml xpath。swyftx_page.content) swyftx_prices_btc = swyftx_tree.xpath('/html/body/section[1]/div/div[2]/div/div[2]/div[2]

浏览 1提问于2022-03-17得票数 0

回答已采纳

1回答

在计算机科学中，获取意味着什么？

、、

在某些情况下，我认为这意味着“数据从一个地方转移到另一个地方”。例如，使用python的sqlalchemy包，将“获取”来自sql数据库的数据，以供python使用。还有其他意义和背景吗？

浏览 1提问于2017-05-21得票数 5

回答已采纳

6回答

通过PHP从网站中提取数据

、、、

基本上，我希望能够从一个网页中提取数据“价格”和“股票可用性”，比如折页2：我已经通过电子邮件和短信部分发出警告，但现在我希望能够从网页(那2页或其他任何一页)获得数量和价格，以便我可以比较价格和数量

浏览 12提问于2010-01-07得票数 8

回答已采纳

1回答

从具有不同结构的不同域(主要是)抓取多个单页面

、、、、

我有一个非常具体的urls列表，我需要从其中抓取数据(不同的选择器/字段)。总共有大约1000个来自大约300个不同网站的链接，它们具有不同的结构(选择器/xpath)。虽然我对这些了解不多，并且仍然在努力理解，但我从网络上发现的似乎如果我使用Scrapy/Python来做这件事，看起来我将不得不为每个链接创建一个单独的爬虫(至少是具有不同结构的)。我想要提取的示例链接和字段如下所示，其中"url“是页面，由"selector”标识的字段是我想要从该页面提取</em

浏览 0提问于2018-08-22得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云