Python可视化(1),历年中国大学学术排行榜

Python可视化(1),历年中国大学学术排行榜

摘要:最近在朋友圈看到一个很酷炫的动态数据可视化表,介绍了新中国成立后各省GDP的发展历程,非常惊叹竟然还有这种操作,也想试试。于是,照葫芦画瓢虎,在网上爬取了历年中国大学学术排行榜,制作了一个中国大学排名Top20强动态表。

打开dist文件夹里面的exampe.csv文件,放进你想要展示的数据,再用浏览器打开bargraph.html网页,就可以实现动态效果了。

同时,可以看到这是世界500强的大学排名,而我们需要的是中国(包括港澳台)的大学排名。怎么办呢? 当然不能一年年地复制然后再从500条数据里一条条筛选出中国的,这里就要用爬虫来实现了。可以参考不久前的一篇爬取表格的文章:

但是表格需要进行处理,比如删除掉不需要的评分列,增加年份列等,代码实现如下:

可以看到美国是用英文的USA表示的,那么我们可以单独提取出src属性,然后用正则提取出国家名称就可以了,代码实现如下:

10年一共5011行×6列数据。接着,读入该表作进一步数据处理,代码如下:

结果非常好,可以直接作为D3.js的导入文件了。

2.4.1. 克隆仓库文件

大概就是这么一个轮播的情况:

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181027A0TMWB00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券