通过手机“追踪”你 不是通过窃听 而是……

“上厕所怎么可以不带手机。”

“我也想早睡啊,但是手机太好玩了。”

“为什么要谈恋爱,是猫不好撸了还是手机不好玩了。”

我懂你,那一部几寸大小的手机,已经成为你生活的一大部分,从“低头族”到离开手机就烦躁不安的“手机综合症”,手机占据了你大量的时间。

但是,当你手里拿着某8某X的时候,有没有想过,你的位置已经被悄悄记录下来。甚至你一天的轨迹,你的生活习惯,都已经在无形中被“窥探”。

(图片来自网络)

监视与监听的桥段,在谍战类电影中屡见不鲜,而曾经热门的电影《窃听风云》,监听设备也从传统的追踪、监听器变成了人手一部的手机,仿佛是想要告诉人们,“一个人是可以被全方位监视的”。

不考虑电影情节是否科学,通过手机“追踪”一个人,在如今是完全可以实现的。

你的手机能够成为一个实时定位的载体,这个方法不需要你打开手机的GPS功能,甚至在你关机时都能预测到你当前的位置。

是不是有点细思极恐

但在这里,我们所用的技术区别于“卧底“与”间谍“,我们利用的,是“手机信令”。

什么是手机信令?

(图片来自网络)

手机信令,是手机与发射基站之间的通信数据,只要你的手机一开机(当然前提是安装了手机卡),信令数据就开始产生了。

许多人都不知道,平均几百米就会有一个基站,自己的手机也一直在与附近的基站进行着联系。

信令数据中始终带有时间位置等信息,显然这些信息是海量的。

过去,对于运营商来说,这些历史大数据由于太过于庞大,只能定期销毁,而没有其他作用。

但在今天,它们甚至能够成为传说中的规划“大杀器”。

我们先来看两张图:

这两张图,是我们团队将手中两个月的手机信令数据(可以说是很庞大了)进行了清洗、筛选、统计、分析和聚合后,制作出的基于手机信令的居住地分布工作地分布的热力图。

通过这两张图,我们可以看出,南宁居住地密集的区域如下:

友爱片区

东葛路、民主路、园湖路附近

大沙田商圈

而工作地分布密集的区域有以下区域:

朝阳商圈

东葛路、园湖路附近

琅东-凤岭商圈

高新技术产业开发区

那么,用手机信令识别出一个人的工作地与居住地,是怎么做到的?

首先,前提全南宁的基站点位数据,它们都有着唯一的编号:

然后,我们将手中的手机新信令数据按照时间分成两个部分(8:00am—8:00pm8:00pm—次日8:00am),分别代表了昼夜的人类活动。

白天时段中,如果某人的手机信令定位在一个基站附近的时间超过两个小时,且在一个月中有超过13天(工作日22天,乘以0.6的系数)都有与此相同的停留,我们则识别此地为该人的工作地。

同理,某人超过18天(30天x0.6)在夜间时段中停留在某基站附近超过两个小时,则识别此地为该人的居住地。

我们就是通过这种方式,经过反复计算、筛选,统计出了每个基站附近的居住地与工作地,再将统计过后的基站数据进行可视化之后,就得到了整个南宁市居住地与工作地的分布情况。

我们将手机信令计算得出的居住地分布结果与第三次人口普查数据进行了对比,发现两类数据中各城区人口所占比例趋于一致:

左:手机信令人口 右:第三次人口普查常住人口

随后,我们将统计得到的居住地分布数据和工作地分布点数据与我们划分的区域单元进行了空间关联密度计算,得出了下面的结果:

居住地分布密度

工作地分布密度

从这两张图当中,我们能够更加直观地对比出区域间的密度差异。不难看出,多数区域的居住人口与工作人口的高低值分布显示一致,下图为选取的部分高值区域与低值区域的居住地和工作地分布密度的条形图:

当然,也有一些区域呈现出居住地与工作地分布密度差异较大的情况,这些区域的职住比相对来说不太平衡:

因此,借助类似上述的对比分析,再做更深入的研究,结合相关专业知识和算法,这份结果还能够分析出南宁的职住状况,从而为规划提供决策支持。

此外,从分析结果中,我们还能够看出一些问题,一些区域面积不大,但人口数量却很多,计算得出的人口数量远远超出了规划人口数

友爱片区就是一个典型的例子,这个片区中不符合规划标准分布密集的城中村也许就是导致此现象的原因。这个时候,规划的不合理性也已被体现出来。

据统计,南宁的城中村多达70多个,快环内就有接近50个,对于某些城中村的混乱和拥挤程度,我想,南宁人多少都有点体会。

万秀村

大沙田

这就也是前文中提到的,手机信令可以成为“规划大杀器”的原因之一。

利用这份数据,我们还可以做很多有意思的分析。比如下面两张图显示的是在朝阳附近工作的人群的居住地分布状况。

可以看出,由于交通等多方面条件因素的限制,人们还是更愿意遵循“就近原则”。

毕竟,相对于晚睡,人们更不能接受早起,若是早起了还被堵在路上,那就更糟心了。

当然,在这一点上,“有房族”和“租房族”、“有车族”和“电驴族”之间的选择也不尽相同,这些,就需要另作分析了。

传统的普查数据,采样率仅为1%-5%,调查的人口往往是常住人口,且调查耗时耗力;而手机信令数据为覆盖率高达70%-80%的真实的大数据,调查的对象为所有的活动人员,并且可以连续多日调查,这将更有利于进行数据更新。

因此可以说,在某些时候,通过手机信令分析得出的结果,会更真实,更有实际意义。

基于手机信令的分析还可以有更多,这篇文章也只涉及到了最浅层,而我们老友数据派也将继续进行探索。

如今大数据话题持续升温,而那些大数据一直将存在着,如何利用、如何通过更深入的分析、挖掘才能获取到更有价值的信息,就是我们应该考虑的事情了。

写在最后的题外话

看到这里,你也发现了吧,手机除了好玩之外,还有着更大的用处。

假如我手上掌握着你的手机信令数据,我就可以知道你的住址和你的工作,知道你去过哪些地方,甚至能够了解你的作息时间和生活习惯。

所以呀,在做任何事情的时候,

我们是否还是需要保留一点“人在做,天在看”的宿命感和敬畏感呢?

(注: 文中所用手机信令数据遵循国家有关规定,为保护个人隐私均已作脱敏处理,处理后的数据不含号码、身份等与个人隐私相关的属性信息,请放心“食用”。)

本文来自企鹅号 - 全球大搜罗媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏玉树芝兰

文科生如何高效学数据科学?

看似无边无际、高深难懂而又时刻更新的数据科学知识,该怎样学才更高效呢?希望读过本文后,你能获得一些帮助。

1371
来自专栏新智元

【Nature 特稿】机器学习算法重构威尼斯千年历史,成为“谷歌和 Facebook”

【新智元导读】瑞士联邦理工学院(EPFL)数字人文科学实验室主任 Frédéric Kaplan 利用机器学习算法,将威尼斯多年的历史以动态的数字化形式传承下来...

3789
来自专栏企鹅号快讯

扫描复制大脑,实现数字化“长生不老”?

逝者如斯,不舍昼夜。每想到生命终将逝去,不禁“蓝瘦香菇”。有没有可能,充分扫描特定个体的大脑,构造一件精神复制品,当斯人逝去,开启这个复制品让它生活在一个虚拟的...

1909
来自专栏VRPinea

创建脸部3D模型,谷歌让你在虚拟世界里也能明眸善睐!

4436
来自专栏量子位

还没通关“猜画小歌”?击败谷歌AI的秘籍在此

不是因为这家公司要被欧盟罚款50亿美元,而是因为Google首款微信小程序“猜画小歌”:跟AI玩我画你猜的小游戏。

1132
来自专栏新智元

【神经拟态计算】 有新灵魂的机器——模拟大脑的计算机

人们喜欢变着花样来形容大脑。以前,大脑被时髦地比作 17 世纪贵族花园中赏心悦目的喷泉背后的水力供应系统。随着技术的发展,大脑先后被形容为电报通信网和电话交换系...

3546
来自专栏大数据文摘

前沿 | 国际可视化盛会PacificVis2017的十个精彩案例

2937
来自专栏CreateAMind

博士这五年 (非常值得学习!)

王威廉:根据我的观察,CMU优秀博士生的一个共同特点就是自己主导研究,推着(push)导师走,而不是被导师催着干活。不论是早期的李开复,后来的沈向洋,还是现在年...

2162
来自专栏数据派THU

送你10本机器学习和数据科学必读书(附PDF下载)

本文共1800字,建议阅读6分钟。 让一系列免费的机器学习与数据科学书籍开启你的夏日学习之旅吧!

4654
来自专栏大数据文摘

前沿 | MIT自动驾驶技术突破:实现浓雾中物体观测和测距,超人类水平

1306

扫码关注云+社区

领取腾讯云代金券