首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

使用superagent、eventproxy与cheerio实现简单爬虫

Node.js需要使用到三个包:express,superagent,cheerio。...express:Node.js应用最广泛的web框架 superagent:http相关的库,可以发起get或post请求。 cheerio:可以用来从网页中以css选择器方式取得数据。...然后使用npm install命令安装express,superagent,cheerio三个依赖。 ? 首先,在app.js文件顶部导入我们刚才所依赖的三个包 ?...别忘了我们这篇文章最重要的是要学习Node.js的异步特性,我们刚才使用superagent和cheerio来爬取首页帖子标题与链接,只需要通过superagent发起一次get请求就可以做到了。...最下方使用一个forEach循环,在循环里通过superagent发起get请求轮流请求帖子链接取得帖子实际内容。然后通过eventproxy的emit方法告诉ep实例我本次请求结束了。

1.5K20
领券