文章/答案/技术大牛

发布

社区首页 >问答首页 >使用node-fetch跳过等待时间

问使用node-fetch跳过等待时间
EN

Stack Overflow用户

提问于 2018-06-10 18:24:21

回答 2查看 426关注 0票数 0

我使用node-fetch和cheerio从comic website中抓取数据。我只用了一个简单的代码来显示正文html，如下所示：

var fetch = require('node-fetch');
var cheerio = require('cheerio');

var url = 'http://readcomiconline.to';

function getComic() {
    fetch(url)
        .then(res => res.text())
        .then(body => console.log(body));
}

getComic();

问题是这个页面使用了一个javascript代码，客户端需要在5秒内等待它才能重定向到主页，所以在加载主页之前我无法抓取任何东西。

我怎么才能跳过这一步，开始从页面抓取数据呢？

谢谢。

node-fetch

node.js

cheerio

回答 2

Stack Overflow用户

发布于 2018-06-10 20:29:08

看起来您需要的不只是这两个模块。

您试图抓取的网站使用JS向/cdn-cgi/l/chk_jschl发送验证并获取cookies。您可以使用selenium或颠倒js。

更多信息请点击此处：Python web scraping : 503 Response with specific site (how come?)

票数 2

Stack Overflow用户

发布于 2018-07-18 00:44:37

你不需要等待5秒，因为它会在浏览器中运行。

您有表单#challenge-form，使用cheerio获取表单的url、method和数据(输入值)，并请求它(保存cookie)。

您可以使用devtool (chrome，或类似于浏览器中请求的检查表单)。

这是我尝试登录facebook：index.js的项目，可能对你有帮助。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/50782729

复制

相似问题

问使用node-fetch跳过等待时间
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用node-fetch跳过等待时间EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用node-fetch跳过等待时间
EN