使用Puppeteer抓取内联div值_如何使用Puppeteer抓取span文本值_Node.js Puppeteer & Cheerio Div表抓取 - 腾讯云开发者社区

node.js、puppeteer

现在我想知道我是否也可以抓取内联元素，示例div是这样的： <div class="distance-info-text distance font-xs-light" data-lat="50.912758301334" data-lng="6.019417197437" data-nid="153">83.8 km</div> 例如，现在我想要内联元素：

浏览 34提问于2020-11-04得票数 0

1回答

Web Scraper (使用puppeteer)只添加html的第一个实例

javascript、html、node.js、web-scraping

我的抓取器只接受第一个class/classname实例，而不接受页面上的其余实例我试着使用一个普通的for循环来代替for-each，我认为这是因为div有一个唯一的类名，这个类名增加了一个设定值我尝试在循环中增加该值，但无济于事。const puppeteer = require("puppeteer"); const siteUrl = "https://toronto.iabc.com/a

浏览 12提问于2019-05-25得票数 0

回答已采纳

1回答

如何在抓取puppeteer和NodeJs时获取div标签的内容

javascript、node.js、puppeteer

我听说过一个叫做puppeteer的库，它在抓取网页时很有用。所以我决定抓取一个游戏网站的内容，这样我就可以存储它的数据，然后再浏览它。但是在我复制了div标记的XPATH之后，我希望puppeteer抓取它的内容，它返回的是空字符串“请注意我做错了什么”。这是我试图抓取here的url 我想刮掉显示6个不同颜色球的结果的div标签。这样我就可以每隔45秒得到这些颜色的数量。 const puppeteer = require(&q

浏览 137提问于2021-01-08得票数 0

1回答

如何使用puppeteer从n个子元素中检索属性值？

javascript、node.js、web-scraping、puppeteer

这段代码将检索我选择的第一个元素的属性值，如果我在xpath中放入/html/body/section/div[3]/img<2>或img<3>，就可以检索连续的img元素的数据。但是，在我要抓取的站点上，父元素可以包含任意数量的img元素，并且我希望获得所有这些元素的属性值。有没有什么方法可以让我把它们全部检索出来？const puppeteer = require("puppeteer")

浏览 21提问于2020-05-11得票数 0

回答已采纳

1回答

带有puppeteer的查询选择器返回空数组

node.js、puppeteer

我使用Puppeteer编写了一个简短的抓取器，用于从页面中提取一些标题。虽然我可以抓取单个元素，就像一个单独的h2，但尝试抓取和返回一组项并不成功。主要是我试图确保我的查询选择器正常工作，我可以在我的Chrome dev工具中运行Array.from(document.querySelectorAll('div.landscape h3.title如前所述，只使用一个单独的querySelect('h2')似乎工作得很好。const <e

浏览 23提问于2019-06-16得票数 1

回答已采纳

1回答

错误:使用虚拟链接器进行网络扫描-无法读取未定义的属性“getProperty”

web-scraping、puppeteer

我试图在RightMove中为所有返回的搜索项抓取URL。这一页是： const puppeteer = require('puppeteer'); const browser= await puppeteer.launch(); co

浏览 0提问于2021-05-01得票数 0

回答已采纳

1回答

如何使用Puppeteer抓取react网站？

javascript、node.js、reactjs、puppeteer

我正在尝试抓取一个使用react的网站，当我在chrome中可以访问我想要的元素时，但是当我尝试使用puppeteer时，我无法访问相同的元素，因为源代码没有加载这些react元素，有什么方法可以访问它吗以下是代码 const request= require('request-promise')const puppeteer =require("puppeteer&

浏览 34提问于2020-03-15得票数 0

回答已采纳

1回答

Web抓取仅在特定类之后出现的类

node.js、puppeteer

这是我想要抓取的一个html的简化示例： <td class='goal'> <span> <span class='cellValue'> 我想要抓取类'cellValue‘下的值，但在我的html中有很多不相关的值。我使用的是puppeteer，我尝试过

浏览 6提问于2019-05-17得票数 0

回答已采纳

1回答

如何让木偶人抓取动态类属性并将其从页面上的元素textContent

javascript、node.js、puppeteer

我试图从一个游戏网站抓取一个特定的Div标签的内容。首先，当您访问站点时，div标签将包含带有未完成类的空内容。每隔45秒，textContent和类属性就会更改为另一个值。45秒，它可能看起来像这样 <div class="ball ball-blue">33<div> 如何让puppeteer访问这样的页面，等待类和文本内容被添加到div标记，然后抓取类也是什么，抓取</

浏览 14提问于2021-02-09得票数 0

回答已采纳

1回答

如何使用cheerio访问shadow dom的内容

javascript、http、axios、cheerio

在使用axios执行GET请求时，我检索到以下HTML正文： request: .then((response) => result = response.data例如： <custom-component></custom-component> 通常，使用cheerio，我可以通过以下命令访

浏览 13提问于2020-03-28得票数 0

1回答

用Puppeteer抓取下拉菜单而不抓取子菜单的最好方法是什么？

javascript、node.js、web-scraping、puppeteer、screen-scraping

我在尝试抓取一个简单的网站时遇到了麻烦，我是新手，因此可能会有一些错误，我从一个带有类别的下拉菜单中检索数据，它是有效的，但我不确定如何避免抓取子菜单，因为收集的文本完全是一团糟。有什么想法吗？const puppeteer = require('puppeteer'); (async()=>{ const browser = await puppeteer.launchawait page.goto('https:/

浏览 1提问于2020-06-21得票数 0

1回答

使用Puppeteer在<h2>标签之间抓取<p>标签

javascript、node.js、web-scraping、puppeteer

我是木偶操纵者的新手，还在学习如何抓取网页。网页的结构是这样的：我要做的是抓取<h2> Status </h2>和<h2>Naam</h2>之间的所有<p>标记。使用我当前的代码，我可以抓取这个页面上的所有<p>标记。只是现在我尝试抓取<h2> Status </h2>之后直到<h2>Naam</h2>的所有<p>标记。我当前的

浏览 29提问于2020-05-25得票数 0

回答已采纳

1回答

使用木偶操纵者无限滚动

javascript、node.js、puppeteer、infinite-scroll

我正在尝试从这个中抓取数据。页面在DOM中的元素中有无限滚动。我有以下puppeteer脚本，可以一直滚动到底部以显示所有数据，这样我就可以抓取数据了。我曾尝试使用await page.waitFor(2000);等待，然后才能进一步滚动，但它似乎不起作用。好心帮助别人吧！covid.rcmedicrew.org/ using their /scripts/getSearch.php API

浏览 9提问于2021-05-21得票数 3

1回答

有没有办法在网页中使用require.js来使用木偶剧？

javascript、web、puppeteer、scrape

我有一个问题在网页中使用木偶剧，我想做一个java脚本抓取器，并将该信息传递到我的index.html页面，我可以在vs代码中使用节点，但不能在浏览器中使用它，当我尝试使用chrome中的代码时，它说要求没有定义，所以经过一些挖掘发现我必须使用Require.js，但我不知道如何使用它，请帮助我这是我的代码 const puppeteer = require('puppeteer'); async functio

浏览 5提问于2020-04-19得票数 1

1回答

如何使用NodeJS和木偶操纵者从udemy中抓取图像

node.js、image、web、puppeteer、screen-scraping

这是我的代码抓取课程标题可以工作，但我在图像方面有问题 const puppeteer = require('puppeteer-extra');puppeteer.use(StealthPlugin()); return

浏览 32提问于2021-11-16得票数 0

3回答

JavaScript傀儡抓取变量

javascript、node.js、web-scraping、google-chrome-devtools、puppeteer

我试图从一个保存HTML数据的变量中抓取HTML数据。你可以看到我的注解，它们标有“<<”。不幸的是，evaluate只能在页面上工作，而不能在div中工作。有人能告诉我如何从包含HTML的变量中抓取信息吗？我也在forEach循环中尝试过这一点，但这会产生原始文档的第一个mealname。let mealName = htmlOfOneProduct.document.querySelector("div.meal__description-texts.

浏览 9提问于2020-03-16得票数 1

回答已采纳

4回答

在Puppeteer中进行Web抓取时如何处理验证码？

javascript、web-scraping、captcha、puppeteer

我正在使用Puppeteer进行Web抓取，我刚刚注意到，由于我在计算机上的访问量，我试图抓取的网站有时会要求验证码。验证码表单如下所示：所以，我需要帮助来解决这个问题。我一直在考虑将验证码表单发送到客户端，因为我使用Express和EJS将值发送到我的索引网站，但我不知道Puppeteer是否可以发送类似的东西。有什么想法吗？

浏览 1提问于2019-04-03得票数 15

2回答

Puppeteer -通过div类搜索元素-返回元素的所有div类

javascript、html、puppeteer

我有一个站点需要抓取，通过搜索特定的div类来查找div上的类列表。例如，如果我们有这样的代码：<div class="main">Main Stuff</div><div</em

浏览 45提问于2018-08-02得票数 0

回答已采纳

1回答

使用Node js进行Web抓取

javascript、html、node.js、web、web-scraping

我一直在尝试从网站上抓取一些数据，并使用Node js将其显示在我自己的网站上。我已经写了一个运行良好的文件。我可以将它打印到控制台进行验证。我想将网页中的数据显示为HTML元素。const puppeteer = require('puppeteer'); const browser = await puppeteer.launch$x('//*[@id="gatsby

浏览 3提问于2020-08-14得票数 0

2回答

从新打开的页面傀儡中获取标题

javascript、puppeteer

我正在尝试获得一个新的选项卡，并用puppeteer抓取该页面的标题。这就是我的东西const puppeteer = require('puppeteer'); /&#x

浏览 0提问于2017-11-16得票数 4

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云