首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用node-fetch跳过等待时间

使用node-fetch跳过等待时间
EN

Stack Overflow用户
提问于 2018-06-10 18:24:21
回答 2查看 426关注 0票数 0

我使用node-fetchcheeriocomic website中抓取数据。我只用了一个简单的代码来显示正文html,如下所示:

代码语言:javascript
运行
复制
var fetch = require('node-fetch');
var cheerio = require('cheerio');

var url = 'http://readcomiconline.to';

function getComic() {
    fetch(url)
        .then(res => res.text())
        .then(body => console.log(body));
}

getComic();

问题是这个页面使用了一个javascript代码,客户端需要在5秒内等待它才能重定向到主页,所以在加载主页之前我无法抓取任何东西。

我怎么才能跳过这一步,开始从页面抓取数据呢?

谢谢。

EN

回答 2

Stack Overflow用户

发布于 2018-06-10 20:29:08

看起来您需要的不只是这两个模块。

您试图抓取的网站使用JS向/cdn-cgi/l/chk_jschl发送验证并获取cookies。您可以使用selenium或颠倒js。

更多信息请点击此处:Python web scraping : 503 Response with specific site (how come?)

票数 2
EN

Stack Overflow用户

发布于 2018-07-18 00:44:37

你不需要等待5秒,因为它会在浏览器中运行。

您有表单#challenge-form,使用cheerio获取表单的urlmethod和数据(输入值),并请求它(保存cookie)。

您可以使用devtool (chrome,或类似于浏览器中请求的检查表单)。

这是我尝试登录facebookindex.js的项目,可能对你有帮助。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50782729

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档