腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Scrapy
:
选择器
返回
带有
.
get
的
完整
元素
(
但
正确
分配
数据
)
、
、
、
我已经意识到我
的
代码工作正常,得到了我请求
的
数据
,
但
print给了我整个
元素
,而不仅仅是我想从css获得
的
类。下面是我
的
代码 def parse_links(self, response): print(cha
浏览 18
提问于2020-11-23
得票数 0
回答已采纳
1
回答
Scrapy
:
选择器
返回
带有
.extract
的
完整
元素
(
但
正确
分配
数据
)
我最近开始学习
Scrapy
(和Python ),
但
遇到了一个特殊
的
问题,到目前为止我还找不到一个解释。我设法找到了一种解决方法(见下文),但我很想了解.extract()行为背后
的
原因。
Scrapy
保存
的
不是定义
的
输出csv中
的
数据
,而是
完整
的
字符串(?)data=u'Basel Bad Bf'>, <Selector xpath='/
浏览 1
提问于2016-01-20
得票数 1
1
回答
Python3抓取网爬虫
、
、
、
、
对于我
的
工作,我必须写一个爬虫,它只保存页面的标题,交付状态和产品
的
数量。以下是我
的
默认蜘蛛代码: name = "quotes" ]
浏览 2
提问于2020-07-20
得票数 0
回答已采纳
2
回答
Scrapy
对XPath
的
翻译是否与Python
的
lxml模块不同?
、
、
、
我试图抓取一个网站,但是我在
Scrapy
的
响应对象上使用
的
Xpath表达式有问题。根据Chrome
的
检查,<tbody>
元素
在文件中。: :: parsed_week_number: ['1&
浏览 0
提问于2020-07-18
得票数 0
回答已采纳
2
回答
Scrapy
:修改响应中
的
元素
和字段
、
、
、
我对
Scrapy
、Python和面向对象编程比较陌生,所以如果我遇到任何术语错误或不清楚
的
地方,我深表歉意。目前,我正在使用
Scrapy
的
选择器
抓取
数据
,并使用lxml修改响应。但是,我希望使用
Scrapy
的
方法来进行修改,而不是使用lxml,因为同时使用
浏览 2
提问于2015-07-19
得票数 6
2
回答
在
scrapy
和xpath中使用布尔()和count()之类
的
函数
、
、
、
因此,我试图使用xpath函数boolean()并使用
scrapy
提取真正
的
false响应,但是所有的
scrapy
返回
都是u'0'。不管它是
返回
布尔值真还是布尔值:false
scrapy
总是
返回
基本上这是我
的
xpa
浏览 13
提问于2017-07-19
得票数 1
1
回答
Scrapy
跟随链接但不
返回
数据
,可能是计时问题?
、
、
我尝试了几种设置,比如延迟下载时间,控制台似乎没有错误,
选择器
从
Scrapy
Shell
返回
正确
的
数据
知道为什么它没有为-o CSV文件收集任何
数据
吗?如果你有任何建议,谢谢你 预期
的
输出是从产品页面<
浏览 22
提问于2021-05-13
得票数 0
回答已采纳
2
回答
Scrapy
- Xpath可以在shell中运行,但不能在代码中运行
、
、
、
、
我正在尝试抓取一个网站(我得到了他们
的
授权),我
的
代码在
scrapy
shell中
返回
了我想要
的
东西,但我
的
爬行器什么也得不到。我也检查了之前所有与这个问题类似的问题,
但
都没有成功,例如,网站没有在主页中使用javascript来加载我需要
的
元素
。我想要理解为什么xpath
选择器
与
scrapy
shell一起工作(我得到
的
正是我需要
的
链接),但是当我在我
的
浏览 36
提问于2018-04-25
得票数 1
回答已采纳
2
回答
为什么xpath
的
文本函数没有显示任何关于
scrapy
selenium
的
数据
?
、
、
、
我正在尝试刮一个
带有
刮硒
的
网站。我正面临着两个问题下面是检查工具
的
屏幕截图: 这是我
的
代码:from
scrapy
.selector importSelector from
scrapy
_
浏览 2
提问于2020-10-29
得票数 0
回答已采纳
1
回答
在
Scrapy
中,如何嵌套Xpath表达式,只需调用/text()
、
、
运行以下网站
的
Scrapy
shell, 对于包含文本
的
div,我有以下
选择器
: In [91]: response.xpath('//*[@br><span class="wrapText">Package: com.lenovo.anyshare.gps</span>\n<br>2,239 downloads </div>
浏览 2
提问于2017-04-13
得票数 0
回答已采纳
2
回答
(Python)在导入
的
模块
scrapy
中找不到任何项目
、
、
我在此路径C:\Users\PATTY\Desktop\Project_Website\
Scrapy
上使用
scrapy
启动了一个项目import
scrapy
class QuotesSpider(
scrapy
.Spider): # Errorstart_urls = ['http://quotes.toscrap
浏览 11
提问于2017-03-02
得票数 0
回答已采纳
1
回答
Xpath获取嵌套项
的
文本不起作用,
但
css起作用
、
、
、
我正在使用
Scrapy
制作一个爬虫,并想知道为什么我
的
xpath在CSS
选择器
中不能工作?我想从这个html中获得提交
的
数量: <a data-pjax="" href="/samthomson/flot/commits/master">text()').extract()response.css('li.commits
浏览 1
提问于2015-09-19
得票数 1
回答已采纳
1
回答
在
Scrapy
中,如果字符串长度非常长,extract_first()不会
返回
完整
的
文本
、
、
我正在抓取一个网站使用
Scrapy
返回
字符串格式
的
json类型
的
文件。 当我使用下面的
选择器
时,我在列表中得到了预期
的
完整
数据
。response.xpath('//p/text()').extract() 该列表中
的
数据
是一个类似json
的
字符串,我需要将其转换为使用json.loads()
的
字典 但是当我使用下面的
选择器<
浏览 26
提问于2019-02-28
得票数 1
回答已采纳
2
回答
基于自定义
数据
的
jQuery - Raphael - SVG
选择器
、
、
、
我已经将一个自定义
数据
属性
分配
给添加到Raphael画布中
的
一些圆圈,如each()循环中所示:如何在画布上找到具有相同事务
数据
值
的
元素
目前我有代码:它应该
浏览 5
提问于2012-06-25
得票数 3
回答已采纳
2
回答
使用xPath
选择器
时不能刮到下一个页面的链接,
返回
空。(使用
Scrapy
)
、
、
我正在使用
Scrapy
并试图刮掉 url,当我请求页面上任何有关产品
的
数据
时,我就会把它拿出来。但是
带有
分页器类和id=paginator1
的
div作为空
返回
,即使它是一个具有对下一页
的
引用
的
表。我尝试过对表和css
选择器
使用xPath
选择器
,
但
两者都
返回
为空。这就是我尝试过
的
,使用css In [29]: response.css('span a::a
浏览 0
提问于2018-02-24
得票数 0
回答已采纳
2
回答
从css
选择器
开始,
Scrapy
返回
整个网页。
、
、
我正在抓取博客文章,遇到了一个奇怪
的
问题。当提取一个
完整
的
元素
而不仅仅是它
的
文本时,
scrapy
将
返回
所选
的
元素
+网页中后面的每个
元素
/结束标记。例如,我有以下代码: name = 'postscraper' allowed_
浏览 1
提问于2021-12-16
得票数 0
2
回答
如何从有刮痕
的
网站获得
完整
的
新闻文章
、
我仍然在学习如何做网络抓取,我正在尝试刮一个网站,从一个索引页所有的文章,然后获取他们
的
信息,以及全文。有了下面的代码,我可以得到我需要
的
所有信息-日期,时间,类别,标题-除了整篇文章。text': news.css('p.categoryArticle__excerpt::text').
get
()没有捕获所有的文本。下面是我到目前为止编写
的
代码: class CoalNewsFromOilPrice(
scrapy
.Spide
浏览 6
提问于2022-07-13
得票数 0
回答已采纳
1
回答
Scrapy
/ Python在保存之前修改提取
的
数据
?
、
、
我正在尝试将一个url附加到一个提取
的
数据
片段中,
但
终生找不到方法。我使用
的
选择器
如下所示:这行代码
返回
如下内容:然后我想附加http:exampleurl.com/images/12306116_l_a1.jpghttp
浏览 0
提问于2018-07-19
得票数 0
1
回答
与浏览器控制台xpath结果相比,
Scrapy
spider
返回
的
值不同
、
、
last"))]/a/span/text()').extract(): catIndex += 1 想要
的
结果是"Books“,当我在Firebug控制台上用xpath检查它时,它
返回
了
正确
的
结果,
但
当我运行爬虫时,它
返回
了
完整
的
3个Li
元素
,不排除class="f
浏览 2
提问于2015-08-29
得票数 0
1
回答
响应不能在
Scrapy
中
返回
整数值吗?
、
、
、
,计数它们,将它们
的
编号
分配
给ktsayisi变量(这里出现了问题)
Scrapy
只
返回
访问
的
链接,而不是我希望函数
返回
的
数字。为什么会这样呢?我想要一个数字来代替这些得到
的
浏览 6
提问于2021-12-12
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Scrapy向导
Scrapy 爬坑记录
Scrapy框架的使用之Selector的用法
python爬虫总结(一)
Scrapy框架的使用之Scrapy入门
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券