Scrapy :无法使用css选择器提取属性字段_在scrapy中使用css选择器提取href和链接_使用Css选择器或xpath提取scrapy中的数据 - 腾讯云开发者社区

python、web-scraping、xpath、scrapy

crapy.loader.ItemLoader(item=None, selector=None, response=None, parent=None, **context)用户友好的抽象，通过应用字段处理器来抓取数据来填充数据项当使用选择器或响应实例化时，它支持使用选择器从网页中提取数据。Parameters item (scrapy.item.Item) --使用对add_xpath()、add_css()或add_value(

浏览 4提问于2022-09-12得票数 1

回答已采纳

1回答

Scrapy :无法使用css选择器提取属性字段

web-scraping、scrapy、css-selectors

</h1> </div> </div> 我希望在div标记中拉出data-id属性下面是我尝试使用CSS选择器的方法 >>> response.css("#content-area div")[0].c

浏览 39提问于2020-05-29得票数 0

回答已采纳

1回答

Python Scrapy无法从类中提取文本

python、css、python-2.7、css-selectors、scrapy

我使用了这个： sel = Selector(response) for cam in cams:我想我已经使用了正确的css选择器，但是我得到

浏览 2提问于2014-02-05得票数 7

回答已采纳

1回答

Scrapy不提取某些选择器中的文本

scrapy

我正在使用Scrapy抓取一个网站，但当我选择某些选择器时，它不会提取其中的文本。该网站为response.css('#informacionmedicos').get()它们都显示了各自的html代码行，但是我看不到出现在DOM中的文本(不是在html行中，也不是使用::text属性</

浏览 4提问于2019-08-19得票数 0

2回答

在Scrapy中有没有比XPath选择器更好的选择？

jquery、xpath、web-scraping、scrapy

像title said一样，在Scrapy中有没有更好的XPath选择器，可以用来轻松地选择html中的数据？我发现XPath有很高的学习曲线，它的语法有点难以使用。我觉得如果jQuery选择器可以在Scrapy中使用或合并，它可以让生活变得更容易。

浏览 0提问于2014-12-17得票数 0

2回答

选择包含具有特定类的div的元素的文本

html、css、scrapy

我使用scrapy选择器来提取下面的html并将其加载到项目加载器中。也就是说，我想提取文本Dry。Sauvignon <td> </div> </td> <&

浏览 0提问于2020-04-08得票数 1

1回答

@src用于Image属性

python、xpath、web-scraping、scrapy

我正在学习Scrapy ，我确实可以下载一个图片到我的本地文件夹，一些特殊的帮助，从Scrapy专家堆叠溢出。 data-zoomImage="http://img5a.flixcart.com/image/lenovo-1100x1100.jpeg &l

浏览 1提问于2015-03-21得票数 1

1回答

抓取蜘蛛不能正确抓取数据

python、python-3.x、web-scraping、scrapy、css-selectors

我正在尝试从我的大学网站上抓取关于循环的数据，使用scrapy进行一个项目，但我的爬虫没有正确地抓取数据。有很多空白元素，而且由于某些原因，我无法抓取通知的'href‘属性。我假设我的CSS选择器是错误的，但我无法找出我到底做错了什么。我用'Selector Gadget‘Chrome扩展复制了我的CSS选择器。我一直在学习scrapy，所以如果你能解释我做错了什么，那就太好了。我正在抓取数据的网

浏览 10提问于2020-11-21得票数 0

3回答

无法从Amazon抓取产品标题

python、css、scrapy

我使用Scrapy在上获取产品的价格和标题。没有问题，以提取价格，但我有标题的问题。不同之处在于我在class属性中看到了"aria-hidded=true“。下面是一个示例。title = response.css(

浏览 2提问于2020-05-24得票数 0

1回答

在单行中抓取所有响应

python、for-loop、scrapy

我是Scrapy的新手，我见过与此相关的其他查询，但我的问题似乎是：from ..items import Sephora3Item name =currentPage=1'] f

浏览 2提问于2020-07-24得票数 0

2回答

规范化空间只适用于xpath而不是css选择器。

python、css、python-2.7、xpath、scrapy

我正在使用scrapy和python提取数据。xpath('normalize-space(.但是，现在我想在css选择器中使用normalize-space。我试过这个： car['Location'] = site.css('normalize-space(div[class=location]::text)&#x

浏览 1提问于2014-01-14得票数 0

回答已采纳

1回答

使用XPATH刮取属性值？

python、xpath、web-scraping、scrapy

我刚刚开始使用XPath进行html抓取，所以我对语法有点困惑。我试图从以下源代码片段中提取url： </a><body>

浏览 2提问于2017-06-25得票数 1

回答已采纳

2回答

如何获得与Scrapy一起使用的正确选择器(CSS/XPath)？

css、xpath、scrapy、selector、screen-scraping

最佳结果将是一个选择器，它提取710家公司()的所有相关信息。 In(1)：response.css("#adminForm > table >

浏览 2提问于2020-04-04得票数 0

回答已采纳

1回答

使用具有特定css类的scrapy提取链接

python、web-scraping、scrapy、screen-scraping、scrapy-spider

使用Scrapy，我如何使用LinkExtractor，它只在下面的链接中提取特定的CSS？看起来我可以使用XPath，但我更喜欢使用CSS选择器。我是否需要编写一个自定义的LinkExtractor来使用CSS选择器？

浏览 5提问于2015-06-17得票数 1

回答已采纳

1回答

Scrapy xpath不工作--只与css-selector结合使用？

python、web-scraping、xpath、scrapy、css-selectors

我尝试使用scrapy抓取以下站点，并尝试使用scrapy shell - 这是基本的爬虫： import scrapy nametmpSEC = response.xpath("//section[@data-automation='AppPresentation_SingleFlexCardSection']") 现在我想提取第一个

浏览 58提问于2021-11-16得票数 1

回答已采纳

1回答

不知道如何使用刮伤的itemLoaders

scrapy、scrapy-spider

我正在努力学习如何使用itemLoaders，有人能告诉我我做错了什么吗？？我想提前感谢你。('div.search-results.organic div.srp-listing'): l.add_css('Details', response.urljoin(list

浏览 1提问于2017-07-05得票数 1

回答已采纳

1回答

从Scrapy* Spider响应中选择元素*

python、web-scraping、scrapy、css-selectors

谁能帮我找出如何从这个用Scrapy抓取的page中提取链接？我已经按如下方式修改了爬行器代码，但我正在努力弄清楚如何使用Scrapy选择器来只生成我想要的链接。import scrapy name = "RMW" def parse(self

浏览 15提问于2020-01-10得票数 0

回答已采纳

1回答

不同相对url中的刮取液url

python、web-scraping、scrapy

我试图提取的pdf以及10k表单(以html格式)使用Scrapy。为了提取它们，我使用以下css选择器：most_recent = response.css("div.view_btn > a::attr(href)").getall()，它按预期返回['/Click(“更正”url = ) 我需要url，因为scrapy将响应发送到另一个函数，以便下载pdf文件：yield Reque

浏览 1提问于2021-08-28得票数 1

回答已采纳

1回答

不能为每个注释获取每个<p>标记

python、web-scraping、scrapy

我试图刮掉一个视频的评论，我可以很容易地得到所有的东西，除了每个特定评论的正文使用刮除本网站： body = Selector(text=response.text).css'video_id&#

浏览 4提问于2021-08-07得票数 0

回答已采纳

1回答

我不能从网站上抓取特定的标题

python、scrapy、css-selectors

我正在使用scrapy从亚马逊网站抓取数据，当我使用选择器小工具显示路径时，它有title类，所以它不会提取该标题。相反，当我为一个类使用{.s-access-title}时，它就可以工作了。我不确定为什么选择器小工具显示了错误的路径。import scrapy name = &

浏览 12提问于2019-04-16得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

选择器属性在ItemLoader对象中的用途和用途是什么？

Scrapy :无法使用css选择器提取属性字段

Python Scrapy无法从类中提取文本

Scrapy不提取某些选择器中的文本

在Scrapy中有没有比XPath选择器更好的选择？

选择包含具有特定类的div的元素的文本

@src用于Image属性

抓取蜘蛛不能正确抓取数据

无法从Amazon抓取产品标题

在单行中抓取所有响应

规范化空间只适用于xpath而不是css选择器。

使用XPATH刮取属性值？

如何获得与Scrapy一起使用的正确选择器(CSS/XPath)？

使用具有特定css类的scrapy提取链接

Scrapy xpath不工作--只与css-selector结合使用？

不知道如何使用刮伤的itemLoaders

从Scrapy* Spider响应中选择元素*

不同相对url中的刮取液url

不能为每个注释获取每个<p>标记

我不能从网站上抓取特定的标题

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐