xpath用于提取特定节点中的所有文本，并使用scrapy将其作为一个元素返回

python、xpath、scrapy

<br></p> This is the second sentence</html> 我想从p节点中提取文本，一个节点中的所有文本都应该作为一个元素返回，我使用scrapy shell，如下所示

浏览 17提问于2019-01-23得票数 0

回答已采纳

1回答

如何从div中提取所有文本，包括来自Scrapy和Xpah同级的文本？

xpath、scrapy

在使用scrapy 2.4从远程URL提取文本时，我发现它只返回此div中的文本，而不返回它的子节点中的文本。例如。<div> <p>text inside child</p> more text </div>

浏览 16提问于2020-12-26得票数 0

回答已采纳

2回答

XPath:如何从一个XHTML节点收集多个文本片段？

java、xpath、xhtml

我试图使用XPath从XHTML页面中的一个节点中提取文本，但在收集给定节点下的所有文本时遇到了问题。问题是，节点(例如参见下面示例中的p元素)可以具有多个子节点(在示例中，例如"b“和"em")和散布的多个文本片段("aaaa”、"bbbb“和"cccc")。然而，我

浏览 3提问于2015-02-24得票数 1

1回答

使用CSS和Scrapy提取所有文本，没有标记-失败

css、text、web-scraping、tags、scrapy

我看到了很多Xpath答案，但没有CSS答案。我已经成功地提取了我所需要的所有文本--但它完全被“包装”了？在标签，字体细节等。我是从网站的几个角色描述。我使用的代码是从Scrapy教程中改编的--我想从站点中提取每个角色的所有与工作相关的文本： f

浏览 3提问于2017-10-31得票数 0

回答已采纳

1回答

Scrapy / XPATH :如何仅从后代和自身中提取文本

xpath、scrapy

span> </span> </main> 我现在想从所有节点中提取所有文本XPATH，而是尝试使用Scrapy中的几个步骤，例

浏览 16提问于2019-02-25得票数 0

回答已采纳

2回答

用Python/Scrapy提取h1中的p

python、html、scrapy、lxml

我正在使用Scrapy从网站上提取一些有关音乐音乐会的数据。至少有一个我正在使用的网站(根据W3C -的说法是错误的)-- h1元素中的p元素。不过，我需要在p元素中提取文本，但无法知道如何提取。我已经阅读了文档，并查看了一些用法，但是对于Scrapy来说，它还是比较新<em

浏览 5提问于2017-06-04得票数 0

回答已采纳

2回答

XPath:获取带有或不带标记的情况下的底层文本

xpath、scrapy

有办法将这两个XPath合并成一个吗？//li[@itemprop="worksFor"]/span/div/a/text()背景是，我希望在我的刮取中看到组织，但呈现的方式不同： (带有a标记)预期结果:标准保险

浏览 0提问于2021-08-07得票数 0

回答已采纳

1回答

无法使用样式组件javascript刮除网站。

javascript、web-scraping、scrapy、styled-components

我的目标问题responseresponse.xpath

浏览 4提问于2020-12-15得票数 0

回答已采纳

1回答

Scrapy没有找到Nokogiri找到的Xpath

ruby、xpath、scrapy、nokogiri

我最近在一个网站工作，需要从几家商店/网站抓取产品.我对python和scrapy有点陌生，因为它编写了原始代码，所以在测试爬虫和Xpath时，我使用Scrapy并打开另一个控制台使用nokogiri (Ruby )进行测试。在特定站点中，我未能使用scrapy提取某些内容，但我发现可以使用相同的xpath</

浏览 0提问于2016-01-19得票数 0

回答已采纳

5回答

提取文本xpath抓取

html、xpath、scrapy

大家好，我想用scrapy中的xpath从html块中提取所有文本。假设我们有这样一个街区： <p>Blahblah</p> <p><a><span>Bliblih</span></a></

浏览 10提问于2014-10-10得票数 8

回答已采纳

1回答

为了了解我想要实现的目标，我试图为我的网站构建一个文章刮板，我想在我所有的网页上迭代链接，提取元数据来确定它是否是一篇文章，如果是，将URL +相关数据存储在一个数据库(Mongo)中。我找到了一个，我想用它检索整篇文章。但我想我已经超过我自己了。下面的代码是我的尝试，它工作，但不迭代。我想我需要一个for循环，但我不知道该怎么做。有人能给我指明正确的方向吗？from scrapy import

浏览 1提问于2015-07-25得票数 1

回答已采纳

1回答

解析使用XPath创建的响应

xpath、scrapy-shell

使用Scrapy，我想从一个HTML格式良好的站点中提取一些数据。使用XPath，我可以提取项目列表，但不能使用XPath从列表中的元素中提取额外数据所有的XPath都使用XPather进行了测试。我已经使用包含网页的本地文件测试了这个问题，同样的

浏览 10提问于2019-06-12得票数 1

回答已采纳

1回答

如何在使用xpath选择器时刮取全部信息

python、web-scraping、xpath、scrapy、selector

我遇到了一个问题，在使用XPath选择器时无法获得所有信息。该行处于开发人员模式。--</address>response.xpath('//*[@id="summary-section"]/div[1]/div[2]/div/div/div[2]/div[1]/a

浏览 4提问于2022-06-25得票数 0

回答已采纳

2回答

Python -尝试使用Scrapy从web抓取中获取URL (href

python、html、web-scraping、scrapy

我正在尝试使用web抓取从网页中获取URL或href，特别是使用Scrapy。但是，当I response.xpath('XPATH').extract() href链接时，它返回一个空列表。我尝试获取的特定HTML元素href是：<a href="#2020-38970" class="redNoticeItem__labelLink" data-s

浏览 27提问于2020-06-11得票数 0

回答已采纳

1回答

Web抓取-我不能使用for循环列出元素

python、for-loop、web-scraping、scrapy

我目前正在建立一个网络刮板，我遇到了一个问题。当我尝试构建for循环，以便按公司对所有信息进行重新分组时，提取仍然将同一类型的所有元素显示在一起。当我意识到它不起作用时，我返回并尝试只显示第一个元素的索引列表，但即使当我键入时，所有元素都会显示给我，就好像没有进行任何特定选择一样 import scrapy f

浏览 4提问于2019-06-27得票数 0

1回答

Scrapy xpath不工作--只与css-selector结合使用？

python、web-scraping、xpath、scrapy、css-selectors

我尝试使用scrapy抓取以下站点，并尝试使用scrapy shell - 这是基本的爬虫： import scrapy namexpath获得了所有相关的部分：(当我尝试len(tmpSEC)时，我得到了30，这对我来说似乎还可以) tmpSEC = response.xpath("/

浏览 58提问于2021-11-16得票数 1

回答已采纳

1回答

硒+刮屑

javascript、python、selenium、scrapy

我正在尝试使用scrapy和selenium，以便能够与javascript交互，并且仍然拥有scrapy提供的强大的刮取框架。我编写了一个访问的脚本，在搜索栏中输入“阿姆斯特丹”，然后成功地点击搜索按钮。单击搜索按钮后，我希望从新呈现的页面中提取一个元素。不幸的是，scrapy不返回任何值。这就是我的代码的样

浏览 4提问于2017-01-10得票数 2

回答已采纳

2回答

刮除链接提取器不允许限制文本

python、scrapy

from scrapy.linkextractors import LinkExtractor TypeError: __init__() got an unexpected keyword argument 'restrict_text' 我试图从谷歌搜索得到“下一步”网址，我想限制提取的链接仅为“下一步”文本，我检查了，我应该做什么来

浏览 0提问于2019-08-09得票数 0

回答已采纳

1回答

表- xpath帮助中的刮擦标记和嵌套标记

xpath、web-scraping、html-table、nested、scrapy

我刚开始刮擦，在从表格中的嵌套标记中提取文本时遇到了一些困难。我似乎使用了基本的xpath提取，但是当我尝试提取每个项目时，我的尝试失败了。我使用extract()方法似乎会产生一个与unicode相关的错误？我只想将下面的< TD >值作为一个项返回。如果我在站点上使用提取()

浏览 4提问于2014-02-03得票数 0

回答已采纳

1回答

如何使用scrapy获取href和相关信息？

python、xpath、scrapy

我学习了scrapy文档和xpath选择器。现在，我想把知识转化为做一个小项目。当我使用chrome developer工具打开上述页面并检查列出的作业时，我发现所有的作业都在这个ul中。href函数获取parse，然后使用response获取parse_details中的相关信息。正如我前面提到的，我在python方面有很好的编程技巧，但是，即使在有了这个xpath之后，我仍然很

浏览 8提问于2016-12-15得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何从div中提取所有文本，包括来自Scrapy和Xpah同级的文本？

XPath:如何从一个XHTML节点收集多个文本片段？

使用CSS和Scrapy提取所有文本，没有标记-失败

Scrapy / XPATH :如何仅从后代和自身中提取文本

用Python/Scrapy提取h1中的p

XPath:获取带有或不带标记的情况下的底层文本

无法使用样式组件javascript刮除网站。

Scrapy没有找到Nokogiri找到的Xpath

提取文本xpath抓取

如何在网站刮刮中迭代

解析使用XPath创建的响应

如何在使用xpath选择器时刮取全部信息

Python -尝试使用Scrapy从web抓取中获取URL (href

Web抓取-我不能使用for循环列出元素

Scrapy xpath不工作--只与css-selector结合使用？

硒+刮屑

刮除链接提取器不允许限制文本

表- xpath帮助中的刮擦标记和嵌套标记

如何使用scrapy获取href和相关信息？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐