如何使用xpath从dict获取数据(Scrapy)_Scrapy:无法从xpath获取数据_Scrapy:如何使用CSS和XPath获取地址？ - 腾讯云开发者社区

、

我正在尝试使用xpath从这个餐厅页面获取供应商id，但我不知道如何获取，因为它在字典中。

浏览 23提问于2020-11-11得票数 0

回答已采纳

2回答

AttributeError：'str‘对象没有属性'xpath’

、、

使用Python3，Scrapy1.7.3使用以下链接 <table border="1" cellspacingclass CybexbotSpider(scrapy.Spider): allowed_domains = ['http://links.com'

浏览 0提问于2019-08-08得票数 3

回答已采纳

2回答

用刮除管道过滤表格数据

、

我已经从一页纸上删除了我想要的表格数据。现在，我想使用管道过滤它们(只有“版本”)：“”“ item = dict()

浏览 5提问于2022-07-19得票数 -1

3回答

尝试使用Scrapy从表中提取数据

、、

我在Vista64位上使用的是Python.org 2.7版本。我有目前的Scrapy代码，现在可以很好地提取文本，但我有点卡住了，因为我不知道如何从网站的表格中获取数据。举个例子，我想获取下表中包含的韦恩·鲁尼的得分统计数据：from scrapy.spider import Spiderfrom scrap

浏览 0提问于2014-07-13得票数 1

1回答

如何使用ItemLoader的add_xpath方法进行索引

、、

我正在尝试重写这段代码以使用ItemLoader类： from scrapy.loader import ItemLoader ..., '//*[@class="link linkWithHash detai

浏览 3提问于2016-10-02得票数 0

2回答

用Python Scrapy抓取BBC时遇到麻烦

、、、

我试图从英国广播公司的科学页面上抓取文章标题和摘要，但一直在获取TypeError。我尝试过异常处理，但没有成功。我的代码如下： import scrapy headline = response.

浏览 38提问于2020-08-24得票数 0

回答已采纳

2回答

使用json.dumps()获取所需的值

、、

我仍在努力使我的头脑围绕json.loads和json.dumps从网页中提取我想要的东西。我想了解一些来自这个的数据，这些数据的格式是： url: 'stage-player-stat' defaultParamsteamId: 32, field: 2我使用的代码如下SgmlLi

浏览 0提问于2014-09-07得票数 0

回答已采纳

1回答

Scrapy:将字典提取为文本存储在脚本标记中

、、

你好, 目标是能够提取数据字典并获取每个键值对的值。Example:>>> enValueError: malformed node or string: <_ast.Name obje

浏览 3提问于2020-01-26得票数 1

回答已采纳

6回答

如何在使用蜘蛛抓取数据之前检查xpath表达式(如果有效/不有效)

、、、

您可能已经意识到了，我正在使用scrapy和xpath提取数据。我尝试并提供了从文件到蜘蛛的xpath(使蜘蛛成为通用的--而不是经常编辑)，我能够按需要提取数据。关于这一点，我想在蜘蛛开始之前检查我的xpath表达式。name = "example&

浏览 0提问于2014-12-09得票数 1

回答已采纳

1回答

如何使用scrapy从javascript实现的多页中抓取数据

、

我想使用scrapy从网页中抓取数据，但是从url.For示例中看不到不同页面之间的差异： __author__ = 'Rabbit'from scrapy.selector import Selectorfrom

浏览 1提问于2016-03-18得票数 0

1回答

如何用刮痕刮取交互式线图

、、

我正试着在上浏览观众图表。我试着检查这一页，但似乎找不到图表的值。我试过检查元素，但我只得到了这个。

浏览 8提问于2022-07-31得票数 -1

2回答

使用Scrapy搜索多个表

、

我需要来自不同表格的数据。在这种情况下，表0:17和表18。我不需要表17。如何在一个Scrapy爬行器中解决它。此解决方案不起作用。Scrapy目前只从表0:17中获取数据，而不从表18中获取数据。trs = tab.xpath('*//tr')[1:] name = tr.xpath(&

浏览 2提问于2020-01-22得票数 0

2回答

Scrapy:如何从<span>中提取属性值

class="ProfileNav-value" data-count="57939946" data-is-compact="true">57.9M</span>(//ul[@class='ProfileNav-list']/li/a/span[@class='ProfileNav-value']/@data-count)[3] 我试图<em

浏览 0提问于2018-10-18得票数 1

回答已采纳

2回答

用Scrapy从刮取的数据构造DataFrame

、、

我在从刮取的数据构建csv类型的数据文件时遇到了问题。我已经成功地从表中抓取了数据，但当涉及到编写数据时，我几天都不能这样做。我正在使用项目，并试图将其写入熊猫数据框架。我正在使用物品列表。['office'] = trs.xpath('//td[3]//text()').extract() age['age'] = trs.<

浏览 1提问于2017-07-06得票数 3

回答已采纳

1回答

规范化-空间不适用于刮伤

、

我试图从网址中的网页中提取章节标题和它们的字幕。这是我的蜘蛛from ..items import ContentsPageSFBItem namenormalize-space(//ol[@class="detail-toc"]//*/text())').extract(); length = len(response.x

浏览 4提问于2017-05-17得票数 1

回答已采纳

2回答

如何使用Python从高图表中抓取数据

、、、、

我正试图从的图表中抓取数据。我试着使用框中数据的各自xpath访问数据，但它似乎不起作用。我试过使用Scrapy：market_value = response.xpath('&

浏览 10提问于2022-09-05得票数 0

1回答

我可以合并从网页上从刮取值到项目上吗？

我定义的项目如下： # define the fields for your item here like: usage=scrapy.Field()title来自第一页，usage来自第二页，storage来自第三页。不，我试着从下面的网页中获取价值 li

浏览 12提问于2022-09-14得票数 -1

1回答

无法使用Scrapy从网页加载和刮取数据

、、

我试图使用Python中的Scrapy框架从中抓取数据，但是当我在并尝试学习如何提取数据，使用或我总能得到空名单。然后，当我在的shell中获取和查看响应时，我会得到一个几乎空白的页面，它不包含我想要刮掉的数据(项目、价

浏览 1提问于2018-07-29得票数 0

回答已采纳

1回答

难以将requests.models.Response转换为scrapy.selector.unified.Selector

这段代码 import requestsresponse= requests.get(url) 获取一个requests.models.Response实例，我可以从其中使用scrapy提取数据 from scrapy import Select

浏览 13提问于2020-07-02得票数 0

回答已采纳

2回答

使用Scrapy无法使用xpath从响应html中提取数据，原因是名称空间

、、、、

我使用scrapy和xpath从网页中提取数据。我的html响应如下，我想提取高亮显示的"a“标记中的href链接。通常我使用response.xpath('//a@id="jr-alt-sw"/@href')获取数据，但在这里，我认为由于名称空间问题，结果是空的。如果存在命名空间，如何获得数据。

浏览 4提问于2020-03-18得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云