我们将以一个完整案例来操作,从数据的获取,数据的清洗,数据的建模,数据的分析以及数据的展示等整个流程来处理。在案例过程中可能涉及到的函数,命令,操作方式等,也可以进行一些知识的稳固。
对于远离家乡打工人群,租房是不可避免的过程,那我们以义乌市场租房为例,来看一个完整案例。
最近考虑去义乌发展,那首先得考虑的就是租房问题。我们如果想租房,第一反应是上网搜索一些相关的出租信息,这里以安居客做为搜索分析查询的来源。
接下来就是我们希望获取的一些信息,在上面这个界面里,我们希望获取到的主要信息有这些:标题,租金,面积,地区,房型,楼层,租赁方式等。
此外我们还需要进行一些数据的获取,例如发布时间,配套设施,这些数据是在详细页面里,我们打开详细页面来看下。
通过这些数据我们能大致判断下整个租赁市场的整体情况,例如平均的租金在多少,哪些地区的租金会比较便宜,一般的房型大小是多少的,包括房型的配套设备有哪些等等。
要做数据分析,首先得有明确的数据分析目标,我们需要获得哪些信息用于哪里?
数据分析的目标:
义乌哪个区房源比较多?
义乌哪里租房比较便宜?
市场的平均租金在多少范围?
市场的租金走势是如何的?
出租的房型通常是怎么样的?等等
我们知道Power Query可以直接通过函数获取网页的信息,我们要想获取这些信息,首先得分析网页的结构以便找到真实数据的存放地方。