Sublime正则 Excel,不写代码也能做数据抓取和可视化

写在前面

本文是上一篇文章《

数据解读高校分布情况与各省高考难度,河南考生要坚强

》的技术实现讲解

在上一篇文章的开头,我提到了文章中展示的数据并不是通过爬虫抓取的,而是我使用Sublime+正则表达式手工清洗的。

部分数据可视化也没有通过编程实现,而是使用Excel完成的;当然,代码实现会稍微方便一点,但是二话不说就写代码可能对于新手不太友好。所以我这次没写代码就是想要给初学的朋友们说:

不是非得会爬虫才能抓取数据,不是非得编程才能做可视化。

好了,下面就开始讲解实现吧。

01

本文要实现的功能

条形图:

饼图:

02

数据的获取

本次数据的来源网站是高考帮:

获取的高校数据如上图所示,合计有2600余所高校,处理过后的数据保存格式如下:(每个学校为一行,保存在Excel中)

那么,不写代码的情况下如何以最快的速度提取这些数据呢?

请参考下面的视频。

视频时长22分钟,二胖建议大家跟着视频动手操作一遍。

如果视频不清晰,或者目前没有时间观看。

二胖已经将高清视频及处理好的数据上传至百度云盘

链接在留言区,需要的同学请自取。

看完视频,学会了么?

如果有同学没有安装Sublime或者不知道怎么使用Sublime,二胖已经把相关资料链接上传百度云盘,链接请于留言区自取。

03

数据的可视化

二胖之前的文章都喜欢用Python来做可视化,而这次使用的是Excel。

为什么这次要使用Excel呢?

主要有两个原因:

在数据量较小的情况下,Excel比写代码要快很多。但之前的文章中有些数据量达到了百万级,Excel就有点吃不消了。

想要告诉一些朋友,其实Excel在数据处理中也扮演着很重要的角色。

本文要讲解的可视化成果已经在文初介绍了,下面就来看看是如何实现该成果的吧。

本次视频不是由二胖录制,是由小姐姐录制,支持一下吧。

视频看完了,相信你已经学会了如何制作简单的可视化图吧。

这也只是Excel功能的冰山一角,希望大家持续学习。

写在最后

在工作中,对于一个问题,我们应当选择以最快最容易的方法解决;

在学习中,我们应当抱着一颗追根朔底的心。

数据可视化亦如此。

为了节约大家的时间,全量数据我已经处理好放在了百度云盘中,除此之外,本文中的两个高清视频、Sublime安装文档我也一并打包啦!

资源在留言区,请自取。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180701G0ZG6X00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券