我们先来看看用POWER BI 做的全球疫情的一个数据仪表盘的案例,这个案例是PB通过获取网站数据,然后通过 PQ 对网站的数据进行清晰,在用数据可视化中的地图来展示全球各个国家的 疫情死亡人数,治愈人数等,在对对家按照州进行分类做数据的筛选(国家太多,随机选择了国家进行分类),那我们来分享下,这个案例是如果来做的。
一、疫情数据的获取
首先PB的数据有很多的获取源,文件,数据库,AZ,各个数据分析的软件等,我们这个案例是通过WEB 网页端来获取数据,并不是常规的 EXCEL 文件,这个好处就是不需要把网页的文件重新下载到EXCEL,然后再导入PB 来完成。
我们百度搜索“全球疫情数”,获得了这个网站 https://fy.onesight.com/
这些数据就是我们需要进行分析的数据,然后我们在PB的数据导入上,选择WEB,粘贴这个网站,就会获取网站的数据。
二、数据的清洗
我们所看到的在PB里导入的数据如上图,但是这个数据并不是我们可以做分析的数据,所以我们就需要用PQ 来对这组数据进行数据的清洗,主要做一下几个步骤
1、删除后面几行的无意义数据
2、拆分“确诊,治愈,疑似,死亡” 数据,每个数据字段一列
3、再对每个字段拆分出数字,因为我们后面做的数据分析是对数字做分析,所以在字段中不能出现“确诊” , “列”等文字
最后我们通过 PQ 对数据进行清洗后,标准的数据表格如下
三、数据的分组
由于全球的国家太多,我们在对全球国家进行数据分析的时候,不可能一个国家一个国家的看,所以我们要对这些国家进行分类,在进行分类的时候,我们的维度是按照国家的 州归属为维度分类,也就是这些国家是属于哪个州的,我们就把这个国家放在这个州里。
其实还有种分类,比如统计死亡人数,我们就按照死亡人数的 从大到小,以一定人数为步长,进行分组,这样我们就可以看到死亡人数最多的几个国家是哪几个国家。
数据,文本的分组我们是通过 PV 中的新建分组实现的。
由于国家太多,我就随机的做了国家和州的分布,其实如果要方便,我们可以通过两个表的数据追踪来自动的匹配,你可以理解成 EXCEL 中的 VLOOKUP。
四、数据建模
有了标准数据后,我们就需要对数据建模,我们在数据的可视化上选择了地图,然后在 “位置” 上选择国家,在颜色的选择上,我们选择“死亡人数”这个字段,地图上会根据每个国家不用的死亡人数,通过颜色的饱和度来呈现各个国家死亡的人数。比如我们看亚洲 , 印度,俄罗斯,伊朗是最严重的三个国家,特别是印度,已经放飞自我。土库曼斯坦,朝鲜,中国都是白色的,说明疫情防控的很好
五、数据交互
在数据的交互上,我们选择以分组的 “州”为切片器的维度进行数据的交互,在看板上 插入切片器 -- 再插入“州”,就会以州为维度进行数据的交互
如果你想看我们做的模型效果,可以在网页中输入下面网址,就可以看到我做的数据模型
https://app.powerbi.com/view?r=eyJrIjoiNjhlODVjNDktODk5Ny00NGYyLTg1MDMtZmRlZWY3ZGEyYjdkIiwidCI6IjZmMGJiNzJmLTUzNzctNGRkZi05MzZhLWI2YzcyYmYyMWFlMiIsImMiOjF9