腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
选择器
属性
在ItemLoader对象中的用途和用途是什么?
python
、
web-scraping
、
xpath
、
scrapy
crapy.loader.ItemLoader(item=None, selector=None, response=None, parent=None, **context)用户友好的抽象,通过应用
字段
处理器来抓取数据来填充数据项当
使用
选择器
或响应实例化时,它支持
使用
选择器
从网页中
提取
数据。Parameters item (
scrapy
.item.Item) --
使用
对add_xpath()、add_
css
()或add_value(
浏览 4
提问于2022-09-12
得票数 1
回答已采纳
1
回答
Scrapy
:
无法
使用
css
选择器
提取
属性
字段
web-scraping
、
scrapy
、
css-selectors
</h1> </div> </div> 我希望在div标记中拉出data-id
属性
下面是我尝试
使用
CSS
选择器
的方法 >>> response.
css
("#content-area div")[0].
c
浏览 39
提问于2020-05-29
得票数 0
回答已采纳
1
回答
Python
Scrapy
无法
从类中
提取
文本
python
、
css
、
python-2.7
、
css-selectors
、
scrapy
我
使用
了这个: sel = Selector(response) for cam in cams:我想我已经
使用
了正确的
css
选择器
,但是我得到
浏览 2
提问于2014-02-05
得票数 7
回答已采纳
1
回答
Scrapy
不
提取
某些
选择器
中的文本
scrapy
我正在
使用
Scrapy
抓取一个网站,但当我选择某些
选择器
时,它不会
提取
其中的文本。该网站为response.
css
('#informacionmedicos').get()它们都显示了各自的html代码行,但是我看不到出现在DOM中的文本(不是在html行中,也不是
使用
::text
属性</
浏览 4
提问于2019-08-19
得票数 0
2
回答
在
Scrapy
中有没有比XPath
选择器
更好的选择?
jquery
、
xpath
、
web-scraping
、
scrapy
像title said一样,在
Scrapy
中有没有更好的XPath
选择器
,可以用来轻松地选择html中的数据?我发现XPath有很高的学习曲线,它的语法有点难以
使用
。我觉得如果jQuery
选择器
可以在
Scrapy
中
使用
或合并,它可以让生活变得更容易。
浏览 0
提问于2014-12-17
得票数 0
2
回答
选择包含具有特定类的div的元素的文本
html
、
css
、
scrapy
我
使用
scrapy
选择器
来
提取
下面的html并将其加载到项目加载器中。也就是说,我想
提取
文本Dry。Sauvignon <td> </div> </td> <&
浏览 0
提问于2020-04-08
得票数 1
1
回答
@src用于Image
属性
python
、
xpath
、
web-scraping
、
scrapy
我正在学习
Scrapy
,我确实可以下载一个图片到我的本地文件夹,一些特殊的帮助,从
Scrapy
专家堆叠溢出。 data-zoomImage="http://img5a.flixcart.com/image/lenovo-1100x1100.jpeg &l
浏览 1
提问于2015-03-21
得票数 1
1
回答
抓取蜘蛛不能正确抓取数据
python
、
python-3.x
、
web-scraping
、
scrapy
、
css-selectors
我正在尝试从我的大学网站上抓取关于循环的数据,
使用
scrapy
进行一个项目,但我的爬虫没有正确地抓取数据。有很多空白元素,而且由于某些原因,我
无法
抓取通知的'href‘
属性
。我假设我的
CSS
选择器
是错误的,但我
无法
找出我到底做错了什么。我用'Selector Gadget‘Chrome扩展复制了我的
CSS
选择器
。我一直在学习
scrapy
,所以如果你能解释我做错了什么,那就太好了。我正在抓取数据的网
浏览 10
提问于2020-11-21
得票数 0
3
回答
无法
从Amazon抓取产品标题
python
、
css
、
scrapy
我
使用
Scrapy
在上获取产品的价格和标题。没有问题,以
提取
价格,但我有标题的问题。不同之处在于我在class
属性
中看到了"aria-hidded=true“。下面是一个示例。title = response.
css
(
浏览 2
提问于2020-05-24
得票数 0
1
回答
在单行中抓取所有响应
python
、
for-loop
、
scrapy
我是
Scrapy
的新手,我见过与此相关的其他查询,但我的问题似乎是:from ..items import Sephora3Item name =currentPage=1'] f
浏览 2
提问于2020-07-24
得票数 0
2
回答
规范化空间只适用于xpath而不是
css
选择器
。
python
、
css
、
python-2.7
、
xpath
、
scrapy
我正在
使用
scrapy
和python
提取
数据。xpath('normalize-space(.但是,现在我想在
css
选择器
中
使用
normalize-space。我试过这个: car['Location'] = site.
css
('normalize-space(div[class=location]::text)
浏览 1
提问于2014-01-14
得票数 0
回答已采纳
1
回答
使用
XPATH刮取
属性
值?
python
、
xpath
、
web-scraping
、
scrapy
我刚刚开始
使用
XPath进行html抓取,所以我对语法有点困惑。我试图从以下源代码片段中
提取
url: </a><body>
浏览 2
提问于2017-06-25
得票数 1
回答已采纳
2
回答
如何获得与
Scrapy
一起
使用
的正确
选择器
(
CSS
/XPath)?
css
、
xpath
、
scrapy
、
selector
、
screen-scraping
最佳结果将是一个
选择器
,它
提取
710家公司()的所有相关信息。 In(1):response.
css
("#adminForm > table >
浏览 2
提问于2020-04-04
得票数 0
回答已采纳
1
回答
使用
具有特定
css
类的
scrapy
提取
链接
python
、
web-scraping
、
scrapy
、
screen-scraping
、
scrapy-spider
使用
Scrapy
,我如何
使用
LinkExtractor,它只在下面的链接中
提取
特定的
CSS
?看起来我可以
使用
XPath,但我更喜欢
使用
CSS
选择器
。我是否需要编写一个自定义的LinkExtractor来
使用
CSS
选择器
?
浏览 5
提问于2015-06-17
得票数 1
回答已采纳
1
回答
Scrapy
xpath不工作--只与
css
-selector结合
使用
?
python
、
web-scraping
、
xpath
、
scrapy
、
css-selectors
我尝试
使用
scrapy
抓取以下站点,并尝试
使用
scrapy
shell - 这是基本的爬虫: import
scrapy
nametmpSEC = response.xpath("//section[@data-automation='AppPresentation_SingleFlexCardSection']") 现在我想
提取
第一个
浏览 58
提问于2021-11-16
得票数 1
回答已采纳
1
回答
不知道如何
使用
刮伤的itemLoaders
scrapy
、
scrapy-spider
我正在努力学习如何
使用
itemLoaders,有人能告诉我我做错了什么吗??我想提前感谢你。('div.search-results.organic div.srp-listing'): l.add_
css
('Details', response.urljoin(list
浏览 1
提问于2017-07-05
得票数 1
回答已采纳
1
回答
从
Scrapy
Spider响应中选择元素
python
、
web-scraping
、
scrapy
、
css-selectors
谁能帮我找出如何从这个用
Scrapy
抓取的page中
提取
链接? 我已经按如下方式修改了爬行器代码,但我正在努力弄清楚如何
使用
Scrapy
选择器
来只生成我想要的链接。import
scrapy
name = "RMW" def parse(self
浏览 15
提问于2020-01-10
得票数 0
回答已采纳
1
回答
不同相对url中的刮取液url
python
、
web-scraping
、
scrapy
我试图
提取
的pdf以及10k表单(以html格式)
使用
Scrapy
。为了
提取
它们,我
使用
以下
css
选择器
:most_recent = response.
css
("div.view_btn > a::attr(href)").getall(),它按预期返回['/Click(“更正”url = ) 我需要url,因为
scrapy
将响应发送到另一个函数,以便下载pdf文件:yield Reque
浏览 1
提问于2021-08-28
得票数 1
回答已采纳
1
回答
不能为每个注释获取每个<p>标记
python
、
web-scraping
、
scrapy
我试图刮掉一个视频的评论,我可以很容易地得到所有的东西,除了每个特定评论的正文
使用
刮除本网站: body = Selector(text=response.text).
css
'video_id
浏览 4
提问于2021-08-07
得票数 0
回答已采纳
1
回答
我不能从网站上抓取特定的标题
python
、
scrapy
、
css-selectors
我正在
使用
scrapy
从亚马逊网站抓取数据,当我
使用
选择器
小工具显示路径时,它有title类,所以它不会
提取
该标题。相反,当我为一个类
使用
{.s-access-title}时,它就可以工作了。我不确定为什么
选择器
小工具显示了错误的路径。import
scrapy
name = &
浏览 12
提问于2019-04-16
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Scrapy向导
Scrapy框架的使用之Selector的用法
原来爬嘶吼网站可以发现这么多乐趣!
Scrapy框架的使用之Scrapy入门
Scrapy框架的使用之Scrapy通用爬虫
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券