前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >你踏破铁鞋想找的高性价比居住地,被他们用这个算法挖出来了 | DT Labo Online

你踏破铁鞋想找的高性价比居住地,被他们用这个算法挖出来了 | DT Labo Online

作者头像
DT数据侠
发布2018-08-08 17:18:09
4150
发布2018-08-08 17:18:09
举报
文章被收录于专栏:DT数据侠DT数据侠

上个月DT君空降深圳发布了《2017深圳城市大数据活跃报告》,发布现场可谓座无虚席。但由于现场时间有限,未能将报告更详尽地向大家解读,不少小伙伴对于整个报告的生成过程非常好奇,也很想知道报告得出的结论如何帮助我们了解自己的生存空间与所在城市的商业格局。本期的数据侠线上实验室,DT君邀请到报告的作者团队成员唐也钦、王越,为大家详细讲述了报告的诞生和数据分析过程。

《2017深圳城市大数据活跃报告》是如何生成的

先来给大家介绍一下这份报告是如何生成的,整个过程分为下图这几个部分:

还没看过完整版报告的小伙伴,可关注DT数据侠公号(微信ID:DTdatahero),回复“深圳报告完整版”获取报告。

首先是数据来源。

我们的数据来源有:百度地图、美团点评、e成、高德地图、中原地产、星巴克以及深圳地铁官网。通过这些合作方我们拿到了最初的20多个类别的数据。

接下来通过数据清理与整合之后,将数据汇总成上面的14项指标,我们称之为BLECTS,包含了商务、居住、休闲娱乐、商业、交通友好度、星巴克偏好等六大指标。

这也是我们想表达的一种理念,我们认为城市的区域应该是多元化的、有特色且各方面均衡发展的。我们在城市的综合评分加入了星巴克偏好,因为我们认为星巴克的选址是非常综合的指标,代表一些商业价值的判断。

指标生成后我们进入了数据分析环节。本次分析类型包括:多维数据的描述性分析,相关性分析,分类分析和聚类分析。

通过上图我们来看看聚类分析的结果。

我们用分层次聚类的方法,将深圳165个地铁站店根据14项指标进行聚类,最终形成五大类别,分别是:宇宙中心的候选人、衣食住行的大本、享受人生的躺玩区、公司达人的聚集地、功能单一的圈地狂。上图中方块的大小就代表各个类别的数量多少。

这张图中的14个小类是在五大类别下的进一步细分,大家可能会好奇这些分类是如何得到的,这就涉及到了我们层次聚类的具体算法,简单来说就是通过计算两类数据点间的相似性,对所有数据点中最为相似的两点进行组合,然后反复迭代这个过程。

那么上面这些站点标签有什么实际作用呢?

先以华强北商圈举一个例子,在这个1.45平方公里的商圈内包含6个站点,其中可以看到,级别最高的“更接地气的平衡区”是华强北站,燕南站,华强路站和科学馆站,这些都可以作为副中心站点。

通过分析区域内不同站点的特征标签,我们能很清楚地知道这个区域的结构特征。对于各个类别站点信息的作用大家可以参考完整版报告。

五个大的类型的站点分别代表了不同城市功能的划分,将他们投射在深圳地图上,可以看出不同地铁线路之间的差别。

以深圳地铁一号线和二号线来举例:

东西向横穿福田、罗湖与南山的一号线是城市的功能主脉,它串联了大多数综合功能实力最突出的宇宙中心候选人(城市中心),一号线向线路两端延伸依次也经过了一些生活型或其他新型商务站点,两端的站点都是对外的交通枢纽。二号线的走势与一号线相似,但走位更偏向南山,形成了比较完整的核心区城市生活链。

隐藏在地铁辐射圈里的区域战争

下面我们来说说隐藏在地铁辐射圈里的区域战争。

城市早期设置地铁站点的时候,往往会聚集在最中心的位置,这些地方往往人口密度较高,经济实力较强,属于需求导向型。之后地铁线路会向边缘地区延伸,让地铁带动区域发展和人口聚集,以此带动需求。

所以我们也通过地铁站的数量,判断其周边的实力与潜力。

上面这张图就是我们对不同区域的划分,根据对每个地铁站的总评分中的数据断点成了几个层级,大家可以将这个图理解为长跑比赛,最上面的是跑在最前面的高分梯队,依次往下形成几大梯队。其中二三四层级占比最多。

加入了一些聚类分析之后,整个梯队中可以看出不同类别的分布情况,比如“宇宙中心的候选人”更多集中在第一梯队。这样的结果其实表明了深圳的地铁发展是非常成熟的,它在服务城市核心区域的同时,也覆盖了人们的生活区,同时延伸向边缘地区带动区域发展。

接下来我们通过上面这张图看看城市区域发展的特性。

之前我们在深圳办活动的时候咨询过很多当地人,觉得深圳哪里是发展的最好的区域,得到的大多数答案是福田区和罗湖区。从我们得到的数据来看,也确实集中在这两个区域。

从图中可以看出,多数的“宇宙中心候选人”类站点集中在这两个区域,“公司达人聚集地”在福田有8个站点,而罗湖区则没有这类偏向工作的区域,更多是生活区域为主。

出现这种状况的原因是由于罗湖发展比较早,建筑密度非常高,属于商业、商务、居住功能杂糅型区域。而福田区的发展较晚一些,在功能上做了更多的职能区分,某些区域在设定上是以办公为主,另一些是以商业为主,因此福田在功能上比罗湖区划分更清晰。

但这种区分其实是深圳中心区的迭代现象,并不能说明福田比罗湖更强势。

我们还通过其他几个地铁沿线经过的区域势力发现,关外的宝安区、龙岗和龙华,这几个区域已经不存在第一层级的站点了,由此可见深圳关内关外的势力差异是很明显的。

但在关内区域用地越来越紧张的情况下,被遗忘30多年的关外是否会崛起还很难说。

深圳性价比高的宜居地究竟在哪里

在介绍完整体情况之后,我们也在思考这些数据框架除了能够全面描绘深圳这座城市的面貌之外,还能提供哪些细节角度,为个人解决衣食住行的问题。

通过不同类别数据之间的交叉分析后,我们也得出了一些有趣的结论。

其中第一个点,就是和每个人都相关的住房问题,这一问题在深圳尤其重要,这座移民城市每年都在吸引着无数人到此工作定居,选择一个合适的居住地也决定了大家会具有怎样的生活质量。

上图是通过指标分析得出的一些深圳宜居站点,其衡量标准主要是考察生活舒适度。

什么是生活舒适度呢?考察生活舒适度并非考察住宅小区建得如何,而是看生活圈的情况。这是一个跳出住宅小区范围的公共空间,所谓生活就是与这个圈层不断产生联系。

对于大多数普通人来说,对舒适的圈层有两个要求:

一是小范围内不同的生活需求都能够得到满足;二是生活圈是开放通达的,可以方便地与城市其它区域产生联系,享受城市其他区域更多的资源与功能,这就需要良好的交通配套。

依据这些生活舒适度标准,我们结合之前提到的BLECTS指标,以居住便利度、商业规模、商业等级、休闲娱乐规模、休闲娱乐活跃度、交通友好度来将这些站点呈现在下面的坐标图中。

横坐标是居住等级得分(房价),纵坐标是居住相关品质总分。通过这个图我们可以看出同一个房价标准下不同站点的居住综合品质差异,找到深圳性价比更高的宜居站点。

我们要寻找的生活功能较强而房价较低的站点位于第二象限,共有39个。

其中超过一半位于福田-罗湖综合功能中心区域,距离商务聚集区都很近。位于罗湖区的15个站点主要分为两个聚集区,一个是城市中最早发展起来的国贸-老街综合功能中心区,被开发强度最大,商业资源也最为密集;另一个则是7号线在罗湖区域内的站点,7号线可以与全城其他所有线路进行换乘,从罗湖北部进入福田南部后,又串起几个适宜居住的站点。

龙岗与龙华二区,具备居住功能的站点一般也是区域内商业资源重点聚集对象,再加上传统关外区域住房价格比核心发展区低,性价比自然比较高。相比之下,南山与宝安二区明显并不那么有热闹生活的烟火气。

如何寻找深圳商业需求未饱和的潜力空间

在衡量了站点的居住性价比之后,我们又将目光放在了地铁站点的商业价值方面。

居住区域的存在必然会带来人的聚集,而人的生活,又必然会产生对各种配套商业的需求。那么深圳居住区附近的商业配套真的就很完善了么?会不会依旧存在一些不饱和的地方呢?这些很有可能就是商业业态可以重点考虑布局的地方。

我们通过将一个地铁站附近的小区数量与商铺数量两组数据进行对比。试图寻找在现有的数据框架下,有哪些居住区域还可能存在值得发掘的生活配套商业空白,以及有哪些早已饱和的区域需要谨慎投资。

从上图中可以看出,图片左下角的站点密度比较大,说明小区数量与商铺数量都少的区域比较多。

我们用两个坐标的平均值作为参照点,将这张散点图划分成为4个象限。

第一象限属于居住与商铺数量都高于平均值的站点,小区数量偏多,配套的商业设施也相对成熟与完善。这一象限的站点包含分布在罗湖老城区的老街、湖贝,二者从时间上来看,属于深圳早期发展起来的区域,其生活的商业配套早已发展地比较完备。另外,居住比较成熟的大新、桃园也属于这一部分,关外实力较强的翻身与龙华也共处这一象限,都属于居住密集、商业配套也比较完备的区域,几乎不存在商业空白。

第二象限靠近左上角的点,代表的是居住数量低于平均值、商业数量高于平均值的地铁站。这些站点很多都属于城市的中心、次中心区域,例如华强路、购物公园、华强北等;或者是附近小区数量不算多,但小商铺分布非常密集的站点。单纯从数量上来看,这些站点的商业饱和度非常高,出现消极商业空间的概率很高,想从这些地方寻找商业空白,意义不大。

第三象限是站点分布最密集的部分,这里的特征是在小区数量、商铺数量上的表现低于平均值的站点。值得注意的是,在这个区域间集中分布了类似香蜜湖、华侨城这样的高端住宅区。这里的小区的数量虽然算不上密集,但人群消费能力比较强。不过目前来看,很多消费需求应该是在步行区域之外完成的。假设能够在这片区域做一些与消费能力匹配商业配套的话,是完全有可能将部分消费力留在区域内的,不失为商机。

“商业空白”最显著的站点,都集中在第四象限:登良、翠竹、太安、新秀、湾厦等这些站点周边的小区数量高于平均值,商业数量低于平均值。

以南山的登良站为例,从数据上看,这里平均每个小区仅有2.4 个生活配套商业。与登良小区数量相似的龙岗的大芬站,平均每个小区具备14.7 个商业配套;小区数量比这两者少的福田的石厦站,平均每个小区有16. 9个商业配套。三者相比,登良在商业上的配套明显出现不足。从数据上来看,第四象限里的站点,很有可能是深圳目前存在商业机遇的一些地区。

编辑 | 赵楠

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-08-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DT数据侠 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • ▍《2017深圳城市大数据活跃报告》是如何生成的
  • ▍隐藏在地铁辐射圈里的区域战争
  • ▍深圳性价比高的宜居地究竟在哪里
  • ▍如何寻找深圳商业需求未饱和的潜力空间
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档