前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >爬取数据不是非要Python

爬取数据不是非要Python

作者头像
用户1564362
发布2020-02-25 15:52:55
6110
发布2020-02-25 15:52:55
举报
文章被收录于专栏:飞总聊IT

以下文章来源于数据管道 ,作者宝器

大家好,我是宝器!

最近有朋友问是否可以不用Python编程就能爬取数据并分析,想起来正好之前写了一篇文章,关于Web Scraper的使用,由于之前忘记标记原创,今天就再发一次。

本文背景

宝器想做头发了!

宝器想做头发了!

.....

别想歪,是去美容美发!

准备问一下上铺老王成都哪几家理发店比较好?怎么预约联系方式呀?地址在哪里呢?贵不贵?(毕竟不是每个人都能享受Tony老师的手活)

如果你也有这样这样的问题,不慌,请看本文正文,一起愉快的去看一下做头发要经过的步骤~

首先

打开屌丝必备之美团,然后找到酒店菜单栏.......

下面的美发一栏。

打开了吧,打开之后会有下面这样的一个图

啊呸!打开错了,应该是这样一个界面图:

你会发现上面的理发店信息数据中只有店名,人均消费这些,但是如果想看更详细的比如电话?比如营业时间怎么办呢?

必须再次点击上图某家店logo(带有二级链接,点击会跳转到下一级页面),打开之后就可以看到对应的每一家理发店更详细的信息了。

接下来就要思考一个问题,如何针对这种多级跳转链接、多元素(字段)抓取数据呢?

我还真..............................................不是不知道~

NOW

愉快的给大家安利一波插件,No BB,Show 工具!Show 方法!

第一步,下载安装Web Scraper。

第二步,安装好之后在第一个链接界面按住F12,创建一个站点。

第三步,添加一个选择器类型为Link选择器,注意,一定要选择Link选择器!

第四步,在二级链接界面同样按F12打开Web Scraper,添加一个element(元素)选择器(母选择器是link选择器)。

第五步,添加一个text选择器(母选择器是element选择器)选择所有你想要的字段信息,比如电话,比如地址,如下:

总结,这篇文章可能是针对有一定爬虫基础知识同学,如果不太懂上面的一些概念(比如元素、选择器等),建议简单阅读一下Web Scraper 官方文档。

你最终会得到如下树形逻辑图(核心思想),其中箭头部分所指就是你要的每一个字段信息。

Last,show 结果:

最后

今天出去忙了一天,这篇文章连夜赶出来的,现在的感觉欲仙欲死,抗不住,分析部分下次再做了。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-02-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 飞总聊IT 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档