腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
puppeteer
进行
web
抓取
找不到
CSS
标记
javascript
、
web-scraping
、
puppeteer
我开始学习用javascript和
puppeteer
进行
web
抓取
。我找到了一个我喜欢的视频,展示了木偶师,我试图
抓取
与视频相同的信息(link)。页面与视频有一点不同,所以我
使用
了我认为正确的标签。 当我尝试查找"h3"
标记
时,问题出现了。
标记
存在于DOM中,但是我的代码拒绝确认它的存在,但是在查找"h2"
标记
时工作得“很好”。utm_campaign=marketingplatform.go
浏览 19
提问于2021-02-07
得票数 0
回答已采纳
1
回答
提取所有
CSS
与木偶?
javascript
、
css
、
node.js
、
google-chrome-devtools
、
puppeteer
我正在对网站的复杂性
进行
一些分析。
使用
无头Chrome/
Puppeteer
为网页中的所有节点提取所有
CSS
(外部样式表、<style>
标记
和内联
CSS
)的最佳方法是什么?我理想的寻找编译
CSS
,格式类似于Chrome开发工具中的“样式”选项卡。
浏览 1
提问于2018-12-12
得票数 2
1
回答
使用
puppeteer
进行
Web
抓取
node.js
、
puppeteer
我认为这是一个显而易见的问题,但我仍然不知道如何从元素中
抓取
文本。 我需要得到文本“你的信用余额为零”。我试着这样做:有帮助吗?谢谢。
浏览 16
提问于2020-05-15
得票数 0
回答已采纳
1
回答
未能在木偶技师中
使用
xpath刮取到下一页的链接
javascript
、
node.js
、
web-scraping
、
xpath
、
puppeteer
我正在尝试从这个中
抓取
下一页的链接。我知道如何
使用
css
选择器来
抓取
。但是,当我试图
使用
xpath解析同样的内容时,事情就会出错。是我得到的,而不是下一个页面链接。const
puppeteer
= require("
puppeteer
"); let url = "https://stackoverflow.com/questions/tagged/
web
-scraping
浏览 1
提问于2021-09-16
得票数 0
回答已采纳
2
回答
木偶人
找不到
选择器
node.js
、
chromium
、
puppeteer
我正在尝试
使用
Puppeteer
进行
一些
web
抓取
,但是脚本似乎
找不到
我正在寻找的选择器。基本上是这样的代码:const year = 18; const
浏览 0
提问于2018-05-30
得票数 10
回答已采纳
4
回答
在
Puppeteer
中
进行
Web
抓取
时如何处理验证码?
javascript
、
web-scraping
、
captcha
、
puppeteer
我正在
使用
Puppeteer
进行
Web
抓取
,我刚刚注意到,由于我在计算机上的访问量,我试图
抓取
的网站有时会要求验证码。验证码表单如下所示:所以,我需要帮助来解决这个问题。我一直在考虑将验证码表单发送到客户端,因为我
使用
Express和EJS将值发送到我的索引网站,但我不知道
Puppeteer
是否可以发送类似的东西。 有什么想法吗?
浏览 1
提问于2019-04-03
得票数 15
1
回答
如何在
puppeteer
上截取下载请求并读取被截取的文件
javascript
、
node.js
、
puppeteer
我正在
使用
puppeteer
进行
web
抓取
,我需要设置一个请求拦截来读取正在从浏览器下载的文件,而不是真正下载它,因为它需要大量的资源来下载、读取和删除它。我已经识别了该请求,但
找不到
读取它的方法 pages[0].on('request', request =>
浏览 23
提问于2019-08-16
得票数 5
回答已采纳
1
回答
在表中
使用
Puppeteer
进行
Web
抓取
javascript
、
puppeteer
我正在试着
抓取
这一页。 const browser = await
puppeteer
.launch();
浏览 0
提问于2020-03-10
得票数 0
2
回答
如何通过
puppeteer
进行
web
抓取
?
javascript
、
node.js
、
puppeteer
但是当我尝试用
puppeteer
做同样的事情时,我得到了UnhandledPromiseRejectionWarning: Error: Evaluation failed: TypeError: Cannotread property 'innerText' of null at __
puppeteer
_evaluation_script__:3:83。const
puppeteer
= require('
puppeteer
'); co
浏览 18
提问于2020-02-07
得票数 0
回答已采纳
1
回答
我必须
使用
node来运行一个
puppeteer
包吗?
puppeteer
在我的应用程序中,我想
使用
puppeteer
进行
Web
抓取
。我把木偶演员的代码放在js文件中,但它不起作用。是否可以在浏览器中运行的java脚本中运行
puppeteer
,或者必须由节点执行?
浏览 0
提问于2019-01-21
得票数 0
1
回答
如果源HTML没有包含实际的编号,我如何才能*webscrape*?
python
我正在尝试构建一个
web
抓取
工具,
使用
python从韩国统计局( some )收集一些统计数据。
浏览 3
提问于2021-02-23
得票数 0
2
回答
用vue js
进行
Web
抓取
javascript
、
vue.js
、
vuejs2
我期待着用Vue js制作一个网络
抓取
应用程序。 这个项目我应该得到什么包??
浏览 2
提问于2020-07-06
得票数 1
1
回答
如何
使用
Cheerio获取已动态填充的LI tat之间的数值
node.js
、
cheerio
如何
使用
Cheerio获取由UL和class
标记
包装的li
标记
中的数字。
浏览 25
提问于2019-06-25
得票数 0
1
回答
在Node.js中检测网站是否有电子商务
node.js
、
web-scraping
、
e-commerce
(我有一个很大的网站列表,所以我可能需要刮它们)任何建议,我可以不
使用
外部网站(如rescan.io/builtwith/等)将不胜感激!谢谢!
浏览 0
提问于2019-03-25
得票数 0
1
回答
使用
Puppeteer
在<h2>标签之间
抓取
<p>标签
javascript
、
node.js
、
web-scraping
、
puppeteer
我是木偶操纵者的新手,还在学习如何
抓取
网页。网页的结构是这样的: 我要做的是
抓取
<h2> Status </h2>和<h2>Naam</h2>之间的所有<p>
标记
。
使用
我当前的代码,我可以
抓取
这个页面上的所有<p>
标记
。只是现在我尝试
抓取
<h2> Status </h2>之后直到<h2>Naam</h2>的
浏览 29
提问于2020-05-25
得票数 0
回答已采纳
2
回答
如何在Nodejs中
使用
document.getElementById()
javascript
、
node.js
、
document
、
getelementbyid
、
dom-node
我试图
使用
nodejs从js文件中的html文件中通过id获取元素。我得到的错误'document未定义‘,因为节点在默认情况下不提供文档对象模型。那么我如何在nodejs中
使用
document.getElementById()呢? 谢谢!
浏览 1
提问于2018-09-10
得票数 5
1
回答
错误code=H14 desc=“没有运行
web
进程”在尝试部署
Puppeteer
应用程序Heroku之后
node.js
、
heroku
、
web-scraping
、
puppeteer
、
yarnpkg
我正在尝试部署一个简单的应用程序到Heroku,它
使用
Puppeteer
执行
Web
抓取
。由于在Heroku中
使用
Puppeteer
存在问题,我需要定义一个buildpack来支持
Puppeteer
,如下所示: code=H14 desc="No
web
processesrunning" 说我没有运行
web
,我尝试
使用
建议的命
浏览 2
提问于2020-12-30
得票数 1
回答已采纳
1
回答
puppeteer
事件错误处理程序不转到catch块
javascript
、
node.js
、
web-scraping
、
puppeteer
我正在
使用
puppeteer
(nodejs)创建
web
抓取
,在
web
抓取
的某些特定部分,我正在监听一个事件,该事件在浏览器启动带有消息的对话框时触发。Error('login_error') try{ page = // Initialize
puppeteer
浏览 43
提问于2019-02-27
得票数 0
1
回答
Puppeteer
:从点击输入标签按钮后不刷新的页面
抓取
html
javascript
、
node.js
、
web-scraping
、
puppeteer
我正在尝试
抓取
一些html后,输入标签按钮被点击。我
使用
page.evaluate()单击按钮,因为page.click()似乎不适用于输入
标记
按钮。我尝试了在
puppeteer
启动选项中
使用
headless:false
进行
可视调试,以验证在单击按钮后浏览器确实导航到了该位置。const
puppeteer
= require('
puppeteer
'); const url = 'http://www.
浏览 44
提问于2019-02-18
得票数 0
回答已采纳
1
回答
在JS反应中用
Puppeteer
进行
Web
抓取
javascript
、
reactjs
、
google-maps
、
puppeteer
我正在尝试
使用
的网络刮刀在我的反应JS项目的学校。import React, { Component } from 'react'; import { Map, GoogleApiWrapper, I
浏览 9
提问于2020-06-17
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
一个浏览器自动化操作的.Net开源库
搭建自动化测试框架的思路及实例演示
Puppeteer的入门与实践
如何让蜘蛛与用户了解我们的内容?
Google推出的爬虫新神器:Pyppeteer,神挡杀神,佛挡杀佛!
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券