把清洗完的数据加载到Power Pivot
插入透视表,同时把数据源选择为使用数据模型。
这时我们可以观察到数据透视表这里的数据选项,在数据图标右下角有个标记,这就代表了是数据模型,而不是一般的表。因为我们这里只涉及到一个查询表上载到数据模型,所以就不存在所谓的关系。
接下来我们就写一些比较简单的度量值来做分析。通过右击数据源,使用添加度量值的方式来进行分析。
出租房源=COUNTROWS('房源信息')
最低租金=MIN('房源信息'[租金])
最高租金=MAX('房源信息'[租金])
最小面积=MIN('房源信息'[大小])
最大面积=MAX('房源信息'[大小])
这里只抓取了20页的数据,我们通过计算可以看到最大面积和最小面积以及最低最近和最高租金差异非常的大,如果我们直接使用平均租金或者平均面积的话,数据可能会失真,差不多和国家统计局计算平均收入一样了。所以在这里我们需要使用中位数来进行分析,这样才能看到大致的出租面积和租金,我们继续添加面积和租金的中位数。
面积中位数=MEDIAN('房源信息'[大小])
租金中位数=MEDIAN('房源信息'[租金])
把这两个数据插入到透视表中。
这样我们可以比较清晰的看到处于中间位置的面积和租金在108M2和3350元/月。
通过数据拖放,我们还可以得到一些随着时间的变化,出租房源以及租金的变化趋势,因为数据抓取的不完整性,所以数据再此处就不展示了。大家可以根据自己的需求添加一定的度量值进行分析。