前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >puppeteer爬取house365租房数据

puppeteer爬取house365租房数据

作者头像
治电小白菜
发布2020-08-25 15:30:29
4600
发布2020-08-25 15:30:29
举报
文章被收录于专栏:技术综合技术综合

很简单, 就是用css选择器扒

1. puppeteer安装依赖

1. 新建项目
代码语言:javascript
复制
$ mkdir house365
$ cd house365
$ npm init
$ npm install puppeteer --save
2. 安装上的相关问题
  • 网络问题 使用淘宝镜像
代码语言:javascript
复制
$ npm config set registry https://registry.npm.taobao.org
$ npm config set disturl https://npm.taobao.org/dist
$ npm config set puppeteer_download_host https://npm.taobao.org/mirrors
  • windows下node-gyp相关问题
代码语言:javascript
复制
$ npm install -g node-gyp
$ npm install --global --production windows-build-tools

2. 观察

  1. 观察要爬的页面, 最简单的列表型, 我们爬每个的链接
  1. 看分页, 第二页开始一一对应

image.png

  1. 输入一个比较大的数字, 看看总页数

image.png

  1. 观察内容页, 这些都用选择器选就是了

image.png

3.开爬

具体代码: https://github.com/klren0312/puppeteer-study/tree/master/house365

4.结果

image.png

image.png

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. puppeteer安装依赖
    • 1. 新建项目
      • 2. 安装上的相关问题
      • 2. 观察
      • 3.开爬
      • 4.结果
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档