腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
xpath
从
dict
获取
数据
(
Scrapy
)
、
我正在尝试
使用
xpath
从这个餐厅页面
获取
供应商id,但我不知道
如何
获取
,因为它在字典中。
浏览 23
提问于2020-11-11
得票数 0
回答已采纳
2
回答
AttributeError:'str‘对象没有属性'
xpath
’
、
、
使用
Python3,
Scrapy
1.7.3
使用
以下链接 <table border="1" cellspacingclass CybexbotSpider(
scrapy
.Spider): allowed_domains = ['http://links.com'
浏览 0
提问于2019-08-08
得票数 3
回答已采纳
2
回答
用刮除管道过滤表格
数据
、
我已经从一页纸上删除了我想要的表格
数据
。现在,我想
使用
管道过滤它们(只有“版本”):“”“ item =
dict
()
浏览 5
提问于2022-07-19
得票数 -1
3
回答
尝试
使用
Scrapy
从
表中提取
数据
、
、
我在Vista64位上
使用
的是Python.org 2.7版本。我有目前的
Scrapy
代码,现在可以很好地提取文本,但我有点卡住了,因为我不知道
如何
从
网站的表格中
获取
数据
。举个例子,我想
获取
下表中包含的韦恩·鲁尼的得分统计
数据
:from
scrapy
.spider import Spiderfrom
scrap
浏览 0
提问于2014-07-13
得票数 1
1
回答
如何
使用
ItemLoader的add_
xpath
方法进行索引
、
、
我正在尝试重写这段代码以
使用
ItemLoader类: from
scrapy
.loader import ItemLoader ..., '//*[@class="link linkWithHash detai
浏览 3
提问于2016-10-02
得票数 0
2
回答
用Python
Scrapy
抓取BBC时遇到麻烦
、
、
、
我试图
从
英国广播公司的科学页面上抓取文章标题和摘要,但一直在
获取
TypeError。我尝试过异常处理,但没有成功。我的代码如下: import
scrapy
headline = response.
浏览 38
提问于2020-08-24
得票数 0
回答已采纳
2
回答
使用
json.dumps()
获取
所需的值
、
、
我仍在努力使我的头脑围绕json.loads和json.dumps
从
网页中提取我想要的东西。我想了解一些来自这个的
数据
,这些
数据
的格式是: url: 'stage-player-stat' defaultParamsteamId: 32, field: 2我
使用
的代码如下SgmlLi
浏览 0
提问于2014-09-07
得票数 0
回答已采纳
1
回答
Scrapy
:将字典提取为文本存储在脚本标记中
、
、
你好, 目标是能够提取
数据
字典并
获取
每个键值对的值。Example:>>> enValueError: malformed node or string: <_ast.Name obje
浏览 3
提问于2020-01-26
得票数 1
回答已采纳
6
回答
如何
在
使用
蜘蛛抓取
数据
之前检查
xpath
表达式(如果有效/不有效)
、
、
、
您可能已经意识到了,我正在
使用
scrapy
和
xpath
提取
数据
。我尝试并提供了
从
文件到蜘蛛的
xpath
(使蜘蛛成为通用的--而不是经常编辑),我能够按需要提取
数据
。关于这一点,我想在蜘蛛开始之前检查我的
xpath
表达式。name = "example&
浏览 0
提问于2014-12-09
得票数 1
回答已采纳
1
回答
如何
使用
scrapy
从
javascript实现的多页中抓取
数据
、
我想
使用
scrapy
从
网页中抓取
数据
,但是
从
url.For示例中看不到不同页面之间的差异: __author__ = 'Rabbit'from
scrapy
.selector import Selectorfrom
浏览 1
提问于2016-03-18
得票数 0
1
回答
如何
用刮痕刮取交互式线图
、
、
我正试着在上浏览观众图表。我试着检查这一页,但似乎找不到图表的值。我试过检查元素,但我只得到了这个。
浏览 8
提问于2022-07-31
得票数 -1
2
回答
使用
Scrapy
搜索多个表
、
我需要来自不同表格的
数据
。在这种情况下,表0:17和表18。我不需要表17。
如何
在一个
Scrapy
爬行器中解决它。此解决方案不起作用。
Scrapy
目前只
从
表0:17中
获取
数据
,而不从表18中
获取
数据
。trs = tab.
xpath
('*//tr')[1:] name = tr.
xpath
(&
浏览 2
提问于2020-01-22
得票数 0
2
回答
Scrapy
:
如何
从
<span>中提取属性值
class="ProfileNav-value" data-count="57939946" data-is-compact="true">57.9M</span>(//ul[@class='ProfileNav-list']/li/a/span[@class='ProfileNav-value']/@data-count)[3] 我试图<em
浏览 0
提问于2018-10-18
得票数 1
回答已采纳
2
回答
用
Scrapy
从
刮取的
数据
构造DataFrame
、
、
我在从刮取的
数据
构建csv类型的
数据
文件时遇到了问题。我已经成功地
从
表中抓取了
数据
,但当涉及到编写
数据
时,我几天都不能这样做。我正在
使用
项目,并试图将其写入熊猫
数据
框架。我正在
使用
物品列表。['office'] = trs.
xpath
('//td[3]//text()').extract() age['age'] = trs.<
浏览 1
提问于2017-07-06
得票数 3
回答已采纳
1
回答
规范化-空间不适用于刮伤
、
我试图
从
网址中的网页中提取章节标题和它们的字幕。这是我的蜘蛛from ..items import ContentsPageSFBItem namenormalize-space(//ol[@class="detail-toc"]//*/text())').extract(); length = len(response.
x
浏览 4
提问于2017-05-17
得票数 1
回答已采纳
2
回答
如何
使用
Python从高图表中抓取
数据
、
、
、
、
我正试图
从
的图表中抓取
数据
。我试着
使用
框中
数据
的各自
xpath
访问
数据
,但它似乎不起作用。我试过
使用
Scrapy
:market_value = response.
xpath
('&
浏览 10
提问于2022-09-05
得票数 0
1
回答
我可以合并从网页上
从
刮取值到项目上吗?
我定义的项目如下: # define the fields for your item here like: usage=
scrapy
.Field()title来自第一页,usage来自第二页,storage来自第三页。不,我试着从下面的网页中
获取
价值 li
浏览 12
提问于2022-09-14
得票数 -1
1
回答
无法
使用
Scrapy
从
网页加载和刮取
数据
、
、
我试图
使用
Python中的
Scrapy
框架从中抓取
数据
,但是当我在并尝试学习
如何
提取
数据
,
使用
或我总能得到空名单。然后,当我在的shell中
获取
和查看响应时,我会得到一个几乎空白的页面,它不包含我想要刮掉的
数据
(项目、价
浏览 1
提问于2018-07-29
得票数 0
回答已采纳
1
回答
难以将requests.models.Response转换为
scrapy
.selector.unified.Selector
这段代码 import requestsresponse= requests.get(url)
获取
一个requests.models.Response实例,我可以
从
其中
使用
scrapy
提取
数据
from
scrapy
import Select
浏览 13
提问于2020-07-02
得票数 0
回答已采纳
2
回答
使用
Scrapy
无法
使用
xpath
从
响应html中提取
数据
,原因是名称空间
、
、
、
、
我
使用
scrapy
和
xpath
从
网页中提取
数据
。我的html响应如下,我想提取高亮显示的"a“标记中的href链接。通常我
使用
response.
xpath
('//a@id="jr-alt-sw"/@href')
获取
数据
,但在这里,我认为由于名称空间问题,结果是空的。如果存在命名空间,
如何
获得
数据
。
浏览 4
提问于2020-03-18
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何使用DNS和SQLi从数据库中获取数据样本
Python爬取西刺免费代理ip
使用带外数据从电子表格获取数据
如何使用BOOTSTRAP完成商品修改获取数据
如何从机器学习数据中获取更多收益
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券