xpath 抓取 - 腾讯云开发者社区

文章/答案/技术大牛

发布

4回答

如何使用DOM和XPath从页面中抓取链接？

、、、、

我有一个卷曲页面抓取与卷曲，并希望抓住所有的链接与一定的id。据我所知，最好的方法是使用dom和xpath。下面的代码抓取了大量的url，但删除了其中的许多，并抓取了不是url的文本。$curl_scraped_page是用卷曲抓取的页面。$dom = new DOMDocument();$xpath = new DOMXPath($dom); $hrefs =$xpath->eva

浏览 0提问于2011-03-25得票数 2

1回答

Web爬行/Web抓取

、、

我正在尝试学习如何抓取/抓取网络，需要一些帮助。我目前正在从以下网站上抓取网页：。然而，我有困难的网络刮这个网站上的价格，评级和覆盖网址。有人能帮我吗？下面列出了我尝试使用的代码。在文章中查看(“//data.xpath@class=‘product_pod’”)：price = i.xpath("//p[@class=&#x

浏览 17提问于2020-03-06得票数 0

1回答

如何使用XPath在iOS上进行刮擦？

、、、、

我正在寻找关于如何在XPath平台上使用iOS的信息。在苹果文档中，我发现了关于XPath 的信息，XPath只能在macOS上使用。我的目标是通过XPath抓取网页，但是我找不到任何有关这方面的信息，而不是XPath，我使用HTMLKit。有没有一种使用XPath脚本在iOS平台上抓取网页的方法？

浏览 2提问于2021-04-22得票数 2

回答已采纳

1回答

使用Python PyQt对Javascript内容进行网页抓取

、、、

我现在正在执行一项任务，系统地从似乎是由javascript呈现的课程列表中抓取内容。我在web上使用PyQt4遵循了一些脚本，但失败了(我在下面复制了它)。我想知道是否有任何方法可以修改以下脚本，以便我可以使用PyQt4抓取这些内容，或者我必须寻找其他方法来实现此目的？

浏览 17提问于2016-09-21得票数 3

1回答

XPath:排除子元素

我使用XPath抓取内容。我要抓取的是具有给定id的div中的内容。在这个div的内部有另一个div，我不想摘录它的内容。我使用以下XPath：但是使用这个XPath，我并不是像我期望的那样从所有的urls中提取，而是从那些我应该使用什么XPath来抓取整个div id="Main&qu

浏览 23提问于2017-03-11得票数 2

回答已采纳

1回答

抓取xpath抓取元

、

我正在抓取这个url：response.xpath("//meta[@itemprop='keywords']/@content").extract()但是当我尝试使用索引从该元数据列表中获取第二个元数据时 respo

浏览 2提问于2018-05-01得票数 0

1回答

如何从多个页面中抓取项目？

、

我正在尝试抓取#页的数据。我已经做了一个可以从一个页面抓取数据的抓取器。但它在刮掉第一页后突然完成了工作# -*- coding: utf-8 -*-import csv raw_product_description = product.xpath(XPATH_PRODUCT_DESCRIPTION

浏览 11提问于2019-11-07得票数 1

5回答

正在使用PHP +SimpleXML抓取...我可以抓取图像，但不能抓取原始文本？

、、

我正试着从网站上抓取一些特定的原始文本。通过这个站点和其他资源，我学习了如何使用simpleXML和xpath获取特定的图像。$xpath = '//*[@id="storyCommentCountNumberquery on the div I w

浏览 4提问于2009-01-01得票数 2

4回答

如何从警报框中获取文本

、

我需要从下面的警告框中抓取一条短信。此警报框出现在url栏上方。下面是我的框架断言的一个例子：任何帮助都是非常感谢的。

浏览 5提问于2015-01-29得票数 5

回答已采纳

1回答

如何使用Scrapy抓取下一页

、、

这是我的抓取代码，我不知道我错了，但是在只抓取第一个page.How中，我可以抓取和遍历页面吗？有没有其他方法可以抓取下一页？www.hurriyetemlak.com/satilik'] def parse(self, response): fiyat = response.xpathsibling"]//div[@class="left"]//text()'

浏览 14提问于2020-09-14得票数 2

1回答

将数据输出到CSV时出现剪贴式格式问题。确保项目数据打印在单独的行上

、、、

我使用Scrapy从网站的第一页抓取信息，并将数据导出为.csv文件，如下所示：我想要获得form的输出： .....} etc{[all 'Title' data], [all 'Text' data]} 我的抓取蜘蛛如下'] = sel.xpath('<

浏览 1提问于2015-10-19得票数 0

2回答

我正在做web抓取，并尝试使用xpath和selenium进行抓取。只需更改我存储在列表中的内容，就可以更改xpath。我想创建一个循环，它可以自动更改xpath并查找内容。"EVENINGS_AND_WEEKEND_EXTRA", "ANYTIME_EXTRA"] name= driver.find_element_by_xpath#this is the required xpath</e

浏览 44提问于2017-07-28得票数 2

回答已采纳

1回答

Rvest html_nodes span div和Xpath

、、

我试图通过读取XPath代码来抓取网站。11232895" data-id="928723" data-abc="0602524361510" data-referecenceta="44205406" data-catalog="1">我想这样做，使用Rvest包与R。= "js-bestRate-show")

浏览 16提问于2018-02-06得票数 1

回答已采纳

1回答

关于XPath选择器的问题(用于Scrapy)

、、、

目的:从div类list_area daily_all中抓取文本数据。使用scrapy shell，我首先“抓取”了我想要抓取数据的网站：https://comic.naver.com/webtoon/weekday.nhn 使用'scrapy shell‘脚本：scrapyshell 'https://comic.naver.com/webtoon/weekday.nhn' 使用xpath，我想从div类&quo

浏览 18提问于2019-06-10得票数 2

1回答

使用foreach循环从页面源中抓取所有类数据

、、

这里我使用DOM从网页中抓取数据。我可以抓取头等舱的数据。我已经为每个人考虑了所有的review-wrapper类。我认为它会迭代，但每次都只显示类似的结果。$dom = new DOMDocument;$xpath= new DOMXPath($dom); $results = $xpath-&

浏览 1提问于2014-04-28得票数 0

1回答

从xpath/css获取输出的困难

、、、、

下面是我正在抓取的一个示例链接：我正在尝试获取互联网号码，我尝试了css和xpathproductOMS = product.xpath("//span[@id='product_ID']").getall()productOMS = product.css(".product_internet_number::text").getall() 下面是我想要抓取的html片段：<span itempr

浏览 4提问于2020-03-05得票数 0

回答已采纳

1回答

网络抓取新技术--是否可以使用路径定位css图像？

、、、

我对网络抓取是新的，我甚至缺乏基本的网络抓取/网络选择器的概念。是否可以使用XPath (使用selenium)定位CSS图像？我知道有一种通过xpath定位html图像元素的方法，但我不确定CSS中是否存在这种情况. 谢谢,

浏览 2提问于2013-12-10得票数 0

回答已采纳

1回答

使用Scrapy抓取多个页面并另存为csv文件

、、、

我要抓取Internshala的所有页面，并提取作业ID，作业名称，公司名称和最后日期，以应用和存储在csv中的所有内容，以便稍后转换为数据帧。('//span[@id="total_pages"]').xpath('normalize-space(.('//div[@class="heading_4_5 profile"]/a').xpath('normalize-space(.).

浏览 1提问于2021-07-08得票数 0

1回答

Selenium:从EBay列表中抓取图像

、

我正在尝试使用Selenium从EBay列表中抓取图像。hash=item1e95585333");List<WebElement> srcs; for(如何抓取此列表的所有图像？

浏览 0提问于2015-08-30得票数 2

1回答

来自网站的Google Sheets IMPORTXML文本字段

、、、、

我正在尝试为符合凯利蓝皮书上特定标准的汽车动态拉取汽车价值。我有一个IMPORTXML查询，它有一个链接到显示汽车以旧换新价值的特定页面。 =IMPORTXML("https://www.kbb.com/Api/3.9.462.0/71553/vehicle/upa/PriceAdvisor/meter.svg?action=Get&intent=trade-in-sell&pricetype=FPP&zipcode=12345&vehicleid=411852&selectedoptions=6762567|true|6762674|fals

浏览 21提问于2019-10-14得票数 1

回答已采纳

点击加载更多

如何使用DOM和XPath从页面中抓取链接？

Web爬行/Web抓取

如何使用XPath在iOS上进行刮擦？

使用Python PyQt对Javascript内容进行网页抓取

XPath:排除子元素

抓取xpath抓取元

如何从多个页面中抓取项目？

正在使用PHP +SimpleXML抓取...我可以抓取图像，但不能抓取原始文本？

如何从警报框中获取文本

如何使用Scrapy抓取下一页

将数据输出到CSV时出现剪贴式格式问题。确保项目数据打印在单独的行上

通过从列表中获取元素来更改xpath

Rvest html_nodes span div和Xpath

关于XPath选择器的问题(用于Scrapy)

使用foreach循环从页面源中抓取所有类数据

从xpath/css获取输出的困难

网络抓取新技术--是否可以使用路径定位css图像？

使用Scrapy抓取多个页面并另存为csv文件

Selenium:从EBay列表中抓取图像

来自网站的Google Sheets IMPORTXML文本字段

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐