数据告诉你,魔都到底算谁的地盘?

《上海女子图鉴》的开播,让我们再一次把目光对准了“沪漂”。远离家乡,“沪漂”们信誓旦旦地要在魔都闯出一片天。可是,当我们说起“上海人”的时候,究竟在说谁?“上海人”的范围内到底有没有这群为了梦想闯荡的“沪漂”们?今天的数据侠就为你送上这个问题最好的答案~

本文转自公众号城市数据团(ID:metrodatateam)

每天都有很多人来到上海,每天也有很多人离开上海。

这里面有上海的原住民,有来沪多年已经安家立业的新上海人,也有怀揣梦想未定归处的年轻人。

当我们说起“上海人”的时候,我们究竟在说谁?上海到底是谁的上海?

下面,我们将从新老上海人(出生地籍贯)视角,尝试回答这个常答常新的话题。


最近,我们与中国电信上海公司合作,利用脱敏数据,对上海居民家庭的籍贯分布特征和人群特征进行了一个小研究。

特别说明: 1-数据脱敏方式为:将个人特征标签在500m*500m地理空间聚合后整体输出,打标方法综合了固网宽带用户数据和手机用户数据。 2-“上海居民”的含义是:从晚上23点-第二天早上8点,出现在上海市内同一500m*500m地理空间的月累计时长超过一定阈值的电信用户。 3-“居民籍贯”是以身份证前几位代码推测的出生地省份,与实际籍贯可能略有出入。

根据这组数据,2017年上海居民的籍贯来源地TOP10及其比例为:

可以看到:

  • 本地籍贯的“老上海人”占比约60%
  • 外地籍贯的新上海人(以下简称为“新上海人”)的主要来源地依次为安徽、江苏、河南、江西、山东、浙江、湖北、福建和四川

是的,上海有40%左右的市民来自于全国各地、甚至全世界各地。由此可以判断,上海早已不仅仅是原住民的上海,而是全国人民乃至全世界人民的上海了。

接下来,我们设计了一组指数,用以比较不同来源地居民的生活状态:

1. 居住空间指数(居住地人群分布比例:每个格子里的某来源地新上海人占总人数的比例、居住空间中心度指数:某来源地新上海人居住在市中心10km范围内的人口占该类新上海人总数的比例) 2. 经济能力指数(包括房屋价值指数、车辆保有指数、手机品牌指数;该指数越大,说明综合经济能力越强) 3. 人生阶段指数(包括平均年龄指数、家有老人指数、家有小孩指数;该指数越大,说明平均年龄越大、或家中有老人小孩的概率越大) 4. 返城比例(2018年春节后返回上海的比例,来源为《2018年Q1滴滴出行报告》)

通过对四个指标的综合评估,我们可以对不同来源地的在沪人口进行分类:

(图片说明:指数都进行了标准化处理,位于0~1区间。上图中线条越贴近边缘说明指数越大,线条越贴近中心说明指数越小;如安徽籍新上海人(右下图红线)的返程比例指数高、人生阶段指数低。)

  1. 老上海人:多居住在市中心地段,综合经济能力强,平均年龄偏大、以家庭为单位生活。
  2. 江苏、浙江籍新上海人:主要居住在中环-外环附近,经济能力与上海人不相上下,在新上海人中属于年龄较大的。
  3. 江西、湖北、福建籍新上海人:主要居住在外环周边,经济能力指标略低于江浙人,年龄居中。
  4. 山东、河南、四川籍新上海人:居住在外环周边和部分郊区,年龄最小,经济能力一般,2018年春节后,有大约四分之一未返回上海。
  5. 安徽籍新上海人:广泛居住在全市各个区域,年龄适中,经济能力较差,但返城率很高。

接下来,我们针对每一个类型具体来看吧。

▍老上海人

老上海人的空间分布规律呈现两极分化:要么住市中心、要么住远郊

(图片说明:上图表示上海人占所有常住人口的比例。颜色越红代表比例越大、浓度越高,越蓝代表比例越小、浓度越低,下同。)

市区的老上海人比例最高的是浦西的市中心。近年来,市中心多为老房子、少有新房子、且房价昂贵,故住房很多都在老上海家族间传承。因此,市中心的老上海人比例得以保持在高水平,而该区域的新上海人相对浓度较低。而浦东的老上海人比例最高的则是南汇地区(临港除外)

同时,老上海人在郊区的青浦、奉贤也有明显的聚集点,而崇明三岛上,崇明和横沙为老上海人集聚。

由于代际传承、生育意愿等诸多原因,老上海人的平均年龄远比新上海人要大:

接近10岁的年龄差距暗示着两件事:

1. 老上海人的老龄化程度非常严重,近年上海城市的快速发展很大程度上依赖于新上海人的支撑。

2. 老上海人的消费动力、消费水平比年轻的新上海人低。这一点,在数据中也有所体现。

一方面,由于占据较好的地段,老上海人的房屋价值远远超过新上海人;另一方面,老上海人对汽车和手机的消费水平却比较低。

老上海人是上海市民群体中最大的组成部分,是上海城市发展的中坚力量,毫无疑问,上海是老上海人的上海。

那么,新上海人的情况如何呢?先来看看占比最多的安徽籍新上海人吧。

▍安徽籍新上海人

有意思的是,安徽籍新上海人在空间分布上与老上海人“互补”。

具体而言,安徽籍新上海人比例最高的地方在松江、金山、嘉定、浦东北部,而这些正好是老上海人比例最低的地方;安徽籍新上海人比例较低的中心城区和青浦、奉贤、浦东南部、崇明等地,则正好是老上海人比例最高之处。

安徽籍新上海人的综合经济能力较差,房屋、车辆、手机三个指标都不突出。然而,他们却非常喜欢上海:

上图中,横坐标代表不同籍贯新上海人的综合经济能力指数,纵坐标代表他们在2018年春节后返回上海的比例。总的来说,经济能力与返城率之间存在一定的正相关性,但安徽籍新上海人却是一个异常值:他们的春节后返沪率远远高于按经济能力测算的预期水平。

安徽籍新上海人更多的分布在了老上海人浓度较低的地方,他们综合经济能力指数偏低,但是对上海的忠诚度很高。他们需要上海,上海也需要他们,毫无疑问,上海也是安徽籍新上海人的上海。

▍浙江、江苏籍新上海人

浙江和江苏虽然地域相近、文化相近,但浙江人和江苏人来到上海以后,居住地的空间比例分布特征却截然不同。请看下图:

浙江籍新上海人在市区有张江、顾村、嘉定新城三个高浓度的小聚集点,在郊区的西南角有枫泾-朱泾有一个高浓度的大聚集点。不难发现,沿着朱泾-枫泾一路西去,便可进入浙江境内,看起来他们是新上海人中最恋家的一个族群。

而江苏籍新上海人则在西南、西北、东方都有较高比例的连片分布,同样与老上海人形成“互补”之势。

经济能力方面,江苏、浙江籍新上海人都处于很高的水平。不同的是:江苏籍新上海人在房屋、车辆、手机三个指标上的表现非常均衡,而相比之下,浙江籍新上海人用更好的手机,但汽车保有指数偏低:

(图片说明:指数都进行了标准化处理,位于0~1区间。上图中“倒Y型”蓝线越长说明指数越大,蓝线越短说明指数越小。)

江浙籍新上海人是与老上海人特征差异较小的一个族群,从历史原因和地域临近的角度不难解释。他们是这个城市中的重要奋斗者,毫无疑问,上海也是江浙籍新上海人的上海。

▍福建、湖北、江西籍新上海人

湖北、江西、福建籍新上海人的空间分布也各有特点。

在空间分布上,湖北籍新上海人有三个明显的高比例带状区域,分别是大张江地区、嘉定和松江。

江西籍新上海人在嘉定北部、宝山北部、松江有大片高比例分布,同时在奉贤、南汇老城区、以及长兴岛西侧也有小片的聚集点。

而福建籍新上海人则没有高密度的大范围分布,而是以“抱团”形式,在徐泾、泗泾、杨行等多处形成小范围组团,这可能跟福建人的宗族、同乡的社会网络文化有关。

福建籍新上海人不仅爱抱团,家庭观念也很重。与相似年龄阶段的其他新上海人相比,福建籍新上海家庭中有小孩的比例更高。

湖北、江西、福建籍新上海人也是各有特色的分布在了上海的不同地区,他们也是上海市民中的重要组成部分。毫无疑问,上海也是湖北、江西、福建籍新上海人的上海。

▍山东、四川、河南籍新上海人

从空间上看,山东、河南、四川籍新上海人的居住空间总体较为边缘,但彼此之间又有所差异。具体请看下列图纸:

山东籍新上海人似乎对于港口、码头等对外枢纽有着强烈的偏好,高比例聚集区分布在外高桥-浦东空港、临港和枫泾。

四川籍新上海人似乎对制造业有更明显的偏好,高比例聚集区分布在金山产业园区、松江产业园区和宝山产业园区。

河南籍新上海人的扩展趋势大概是“山东+四川”,在外高桥、嘉定北部、松江西部均有高比例集聚点。

总的来说,山东、河南、四川籍新上海人的居住空间较为边缘化(居住空间中心度指标较低)。住得远,可能意味着更少的工作机会、或者更长的通勤时间、或者不那么完善的生活服务和娱乐服务。

但同时,他们又是这个城市里最年轻的一群人:

可以看到,人生阶段指标下的三个分指标(平均年龄、家有老人、家有小孩)间存在明显的同步变化。比起年龄较大、已经成家立业的江浙沪人,年龄较小的四川、山东和河南籍新上海人更多是独身、或与年龄相仿的好友/情侣一起在沪打拼。

但是,在2018年返乡过春节后,大约25%的四川、河南、山东籍新上海人没有再回到上海:

可以看到,返城率与人生阶段指数(指数越小,说明平均年龄越小、家有老小的比例越低)呈现显著的正相关(相关性系数为0.905)。越年轻的人,回来得越少,离开得越多。

山东、四川、河南籍新上海人是最典型的奋斗者形象,他们是这座城市的最具活力的市民。虽然有返乡意愿加强的趋势,但是,毫无疑问,上海也是山东、四川、河南籍新上海人的上海。

▍写在最后的话

以上是我们通过数据对不同出生籍贯上海居民的居住空间和生活状态的一些推测。然而,所谓“生活状态”,并不是冷冰冰的数字,而是一个“如人饮水,冷暖自知”的命题。

我们并不真切地知道,新上海人在上海过得怎么样。我们只知道,他们还没有进入上海的心脏(市中心)。请看下图:

(图片说明:上图表示新上海人占所有常住人口的比例。颜色越红代表比例越大、浓度越高,越蓝代表比例越小、浓度越低。)

至此,请允许我们暂时脱离一个严谨的数据分析师的角色,涉嫌过度发挥的脑补一张画面:

几百万新上海人,高浓度的聚居在外环以外,每天奔波在路上3个小时以上,只为了心中的梦想,也许是为了逆袭人生出人头地、也许是为了给孩子更好的教育机会、也许仅仅是为了生存和糊口……

当我们重新提出这个问题:上海是谁的上海?

我们想说,上海应该是所有奋斗者的上海,上海应该属于每一个来此只身闯荡的人,上海应该属于每一个来此逐梦青春的人。不仅如此,上海应该公平、包容的对待每一个奋斗者,这才是我们心中的上海,这才是我们心中的伟大城市。

注:内容仅为作者观点,不代表DT财经立场。

作者 | 团支书、T1000

题图 | 站酷海洛

▍数据侠门派

本文数据侠来自城市数据团,他们关注生活在城市中的个人,致力于用市民的生活轨迹,数字化地描绘城市生活、揭示城市问题。

原文发布于微信公众号 - DT数据侠(DTdatahero)

原文发表时间:2018-05-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

GOAT使用AI来验证鞋子的真伪

鞋子的仿品和假冒品如此之多,所以如果你想在Craigslist或eBay这样的二手在线市场买到一双Nike Air Force 1,你怎么能肯定它们是真的?

30130
来自专栏数据的力量

耶鲁大学博士讲述:中美精英生活方式大不同

我的生活圈子里,成功者较多。这当然和高学历的教育背景有关系。最近渐渐发现,这些朋友中的中国人,虽然大多和我一样是博士,但居住在美国的和居住在中国的在业余习好上越...

11730
来自专栏PPV课数据科学社区

大数据揭另类爱情报告:每4对新婚有1对离婚

? 据经济之声报道,《2013-2014年中国男女婚恋观调查报告》正式发布,报告由婚恋网站世纪佳缘发起,通过72660份有效数据样本,对2013年的婚恋热点进...

37160
来自专栏龙行天下CSIEM

科学瞎想系列之四十四 关于空气

空气对我们每个人乃至地球上的每个生物都不可或缺,但由于空气在我们生存的环境中无处不在,唾鼻可得,因此往往又容易被人们忽视,宝宝们经常用"在你面前我就是空气"来...

28030
来自专栏编程坑太多

家里有5套房子的人愿意996吗?只有加班的人才懂!

PS:我工作一直还算努力,原因无非两点:一,认真工作取得好的结果,可以带来无与伦比的成就感。第二,认真工作锻炼能力,能增强自己的气场和魅力。总之,难道你条件很好...

15760
来自专栏量化投资与机器学习

【价值投资逻辑】高质量、低估值选股模型(代码+报告)

在回测区间的各个调仓日选出的股票数在18只-86只之间,2009年4月-2009年7月、2014年10月-2015年2月、2015年10月-2016年3月三个时...

26450
来自专栏数据的力量

著名的竞争战略研究模型——麦肯锡5Cs模型

14220
来自专栏大数据文摘

16万Facebook数据告诉你,单身狗更爱养猫

341100
来自专栏DT数据侠

打破消费降级“幻觉”,数据看方便面、榨菜和二锅头三驾“假”车

当我们看到「方便面、榨菜、低端白酒」,这个所谓「消费降级三驾马车」的正反两方辩论时,我们不妨去仔细想一想这三个产品背后,他的本质,到底意味着什么。

12940
来自专栏PPV课数据科学社区

深度报告 | 中国宏观经济数据分析入门

有奖转发活动 回复“抽奖”参与《2015年数据分析/数据挖掘工具大调查》有奖活动。 论坛君 本文为光大证券首席经济学家,中国首席经济学家论坛徐高理事对中国宏观经...

1.2K70

扫码关注云+社区

领取腾讯云代金券