赋值元素后，抓取xpath提取文本

、、、

我有这样的html <h1 id="1"><i>2</i>sample contents</h1> 我知道，通过使用下面的工作，可以在没有html的情况下完美地获取文本。response.xpath('//*[@id="1"]/text()').get() # sample contents response.xpath('//*[@id="

浏览 12提问于2020-09-15得票数 0

回答已采纳

1回答

Xpath在控制台中正确定位html元素，但在使用scrapy响应时返回空数组。

、、、、

我已经成功地为一些选择器抓取了数据，这些选择器本质上只是html文本，但是其他一些选择器正在收集任何东西。当我试图从每个票证中刮取音乐会日期时，响应中会返回一个空数组，尽管我使用的xpath在开发人员控制台中运行时返回所有正确的日期。我在类定义中定义项的方式有问题吗？.*', )), callback='parse_item')) tickets_list_xpath = '.HtmlXPathSelector(re

浏览 3提问于2015-06-27得票数 2

回答已采纳

2回答

如果selenium中的文本元素被主体标记分割，如何访问它

、

在网页抓取数据的过程中，当我试图访问网站上的一些值时，我遇到了问题。问题是，我想要提取的文本在类中，其中包含由标记分隔的几个文本(这些正文标记也有对我来说也很重要的文本)。因此，首先，我尝试使用我需要的文本(在本例中为“类别”)查找标记，然后从正文标记赋值下面的文本中提取确切的类别。我可以使用精确的XPath，但是这里不是这样的，因为我需要在web上抓取的其他页面在这个侧边栏中包含了不同数量的行，所

浏览 1提问于2020-05-17得票数 0

回答已采纳

1回答

如何从另一个同级元素中提取一些元素(n)之外的xpath同级元素？

、、、

我一直在解析github文档页面的HTML，并在此过程中了解了一些xpath。然后，使用，我从xpath语句中得到一个元素列表：从这里开始，我对上面xpath</em

浏览 0提问于2018-04-13得票数 0

回答已采纳

2回答

selenium抓取在前几个元素后返回空字符串

、、、

我正在使用python中的selenium抓取一个网站。xpath能够找到包含搜索结果的20个元素。但是，该内容仅对前6个元素可用，其余元素为空字符串。结果的所有页面都是如此results = driver.find_elements_by_xpath("//li[contains(@class, 'search-result search-result__occluded-item ember-view&#

浏览 3提问于2017-03-03得票数 3

1回答

无法使用python路径从选项卡中提取数据

、、

您好，我正在尝试从页面的选项卡中提取数据我在试着提取位置我使用下面的python代码和path(使用google chrome inspect)。priva-the-invincible-and-reusable-camera-privacy-s/description') testxpath= test_pagetree.xpath

浏览 2提问于2016-02-20得票数 0

2回答

获取具有特定span类python selenium的页面中的所有元素

、、

您好，我正在尝试使用python中的selenium抓取多个页面。我感兴趣的是提取属于span类元素的所有元素，基本上我想做的是获取span类元素，然后提取其中的链接。对于每个页面，都可以通过使用xpath来实现这一点，但是每个对象和每个页面的xpath都会发生变化。下面是一个web元素的示例： 📷 基本上，我想提取元素，这是一致的，在所有的页面，我将抓取。所以我的想法是获

浏览 30提问于2020-10-29得票数 0

回答已采纳

1回答

在xpath中获取文本值，而不包括脚本

、

你好，我刚开始使用web抓取和X路径，我在ID main中的scrapy (python框架)中使用了以下x路径，如何修改xpath以不收集“脚本”和“样式”中的文本？my_list=response.xpath('//*[@id="main"]//text()').extract() 在网上搜索后，我发现我可以使用|放置多个x路径(在我的例子中，每个标记都是特定的)，但是这是不有效的，因为文本可以在任何标记

浏览 1提问于2019-12-02得票数 1

回答已采纳

1回答

如何利用Google中的XPath从踢起器抓取文本

、、

我正在尝试从踢起器中提取位置数据，以添加到我现有的数据集中。IMPORTXML(A1, $A$2) 成功地抓取了整个列表元素(晋升

浏览 1提问于2018-04-29得票数 0

1回答

如何从selenium中的模型对话框中提取文本？

、、、

我试图从"“中抓取数据，只需单击”获取原始列表“即可提取数据，这将打开网站内的一个模型框，您可以轻松地复制或提取该数据。所以我试着用正常的方法提取文本但它让我看到了一个错误我按照这个答案来解决这个问题 WebDriverWait(driver, 10).until(EC.elemen

浏览 0提问于2020-06-11得票数 0

回答已采纳

5回答

提取文本xpath抓取

、、

大家好，我想用scrapy中的xpath从html块中提取所有文本。<div> <p><a>Bluhbluh</a></p></div> 我想把文本摘录为我希望<em

浏览 10提问于2014-10-10得票数 8

回答已采纳

1回答

Scrapy Spider

、、、

我正在尝试抓取亚马逊，但我获得的file.csv是空白的。: ml_item['articulo'] = response.xpath="result_0"]/div/div/div/div[2]/div[1]/div[1]/a/h2').extract() ml_item[

浏览 0提问于2018-03-25得票数 1

1回答

使用xpath从html中提取文本

、

我想从html中提取文本，就像这样-Written by()] 然后，它必须提取一个单独的文本“由Apache Indian (as Stephen Kapur)和Ervin Barrington Woolley编写”，但上面的命令提取三个文本元素“由”，

浏览 0提问于2015-05-02得票数 2

2回答

如何使用Xpath选择第二个<p>元素

、

(完整评论-点击“阅读更多”按钮后)。我使用RSelenium来做这件事。我可以使用下面的代码从第一个<p>元素中选择和提取文本这是为了减少文本审查但是不能使用代码提取全文评论 reviewNodes <- mybrowser$findElemen

浏览 0提问于2016-04-01得票数 2

1回答

Python/selenium网络抓取

、

data_links中的链接:driver.get(链接)# get the size of company我正在尝试抓取一个网站。我正在使用selenium/python从跨度中剔除“501to1000名员工”和"Biotech &制药“，但我无法使用xpath.I从网站中提取文本元素。这是每次迭代的输出:我没有得到文本

浏览 10提问于2017-07-30得票数 1

回答已采纳

1回答

如何从extract_first()输出中删除xpath？

、、

我正在从一个网站中抓取信息，并使用.extract_first()提取元素。相关代码：name = sel.xpath('//li[@class="inline如何摆脱xpath，以便输出的输出只是元素文本？谢

浏览 1提问于2020-02-18得票数 1

回答已采纳

1回答

如何使用xpath定位器访问特定或所有文本元素？

、、

目前使用Python和Selenium来抓取数据，导出到CSV，然后根据需要进行操作。我很难掌握如何构建xpath语句来访问动态生成的页面上的特定文本元素。)，后面是与产品卡关联的所有文本字段。下面的语句允许我提取"Flower“类别下的所有标题(某种程度上)，但我无法访问该产品中的所有子文本元素，只能访问标题的一个奇怪变体。xpath方法似乎很理想，因为它允许我提取这些数据，而不必使用key passes

浏览 14提问于2021-05-05得票数 0

回答已采纳

1回答

使用selenium在网页上的两个文本值之间选择元素

、、、

我正在尝试从中抓取文本值。我对同义词节感兴趣，但是在整个网站中使用的标记也用于其他部分。有人能帮我

浏览 2提问于2020-03-31得票数 1

回答已采纳

1回答

使用python在selenium中查找具有&nbsp和相应值的元素

、

我有下面的html代码，我正在尝试找到元素的标题和相应的文本。如何使用find_element_by_xpath提取这些值？

浏览 0提问于2021-03-20得票数 0

1回答

在包含"sometext“的网页中获取链接的xpath

、、

是否可以在网页中获取某个元素(包含"sometext")的xpath，以便提取具有类似xpath的元素？我不希望我的xpath被硬编码，因为我将爬行多个网站。

浏览 2提问于2016-01-16得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Xpath在控制台中正确定位html元素，但在使用scrapy响应时返回空数组。

如果selenium中的文本元素被主体标记分割，如何访问它

如何从另一个同级元素中提取一些元素(n)之外的xpath同级元素？

selenium抓取在前几个元素后返回空字符串

无法使用python路径从选项卡中提取数据

获取具有特定span类python selenium的页面中的所有元素

在xpath中获取文本值，而不包括脚本

如何利用Google中的XPath从踢起器抓取文本

如何从selenium中的模型对话框中提取文本？

提取文本xpath抓取

Scrapy Spider

使用xpath从html中提取文本

如何使用Xpath选择第二个<p>元素

Python/selenium网络抓取

如何从extract_first()输出中删除xpath？

如何使用xpath定位器访问特定或所有文本元素？

使用selenium在网页上的两个文本值之间选择元素

使用python在selenium中查找具有&nbsp和相应值的元素

在包含"sometext“的网页中获取链接的xpath

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐