专栏首页华章科技300亿条出租车数据里的五大秘密:上海8点13分最堵,司机凌晨喜欢把车停靠在…

300亿条出租车数据里的五大秘密:上海8点13分最堵,司机凌晨喜欢把车停靠在…

副院长已经好久没出现了,大家有没有想我呢?你们见不到我的时候,我都在冷却技能学习新技术,才能给大家带来更有趣的数据研究。这次我们探究了2015年上海政府公开的强生出租车数据,发现了5个秘密……

上海强生出租车公司的出租车每隔10秒钟会自动向总部的服务器发送一条数据,记录自己所在的经纬度、车速、车内是否有人、行驶方向等信息。2015年上海政府公开了4月一整月的出租车数据,足足有300多亿条,占空间300多G。这些数据被导入了我们的Hadoop平台,以便后续研究。以下是我们初步探究发现的秘密。

- 秘密1 -

上海的交通如烟花般绚烂

上图是根据这300亿条数据绘制出的上海各时段各点的车流量示意图,很显然越红越亮代表那个时段的车流量越多,越暗越黑代表那个时段的车流量越少。

可以看到,上海的道路纵横交错,车流量生生不息。市中心理所当然是车流量最集中处,特别是南北高架和延安路高架,哪怕是夜深人静的时候,依然有许多出租车在上面飞驰,可见上海果真是一个不夜城。

右下方通往浦东国际机场、非常显眼的是华夏高架路,它也是一条非常繁忙的道路,连接着中国通向世界各地的窗口。

- 秘密2 -

上海8点13分最堵

上图是根据数据绘制的上海一天中每分钟的车辆平均速度,工作日的六点左右有一个速度高峰,估计那是出租车司机早上出门接人的时候。而7点到9点、17点到20点,是早晚上下班高峰,有两个明显的速度低谷。早高峰车速的最低点发生在8:13,平均车速29KM/H,晚高峰车速的最低点发生在17:47,平均车速30KM/H,这两个时间应该就是上海最堵的时刻了吧。

- 秘密3 -

周六路上并不空

上图是2015年4月一整月每天出租车的平均车速。很明显,4月4、5、6日三天车速特别快,路上很空,因为那是清明假期,扫墓的扫墓,踏青的踏青,宅的宅,市区人比较少。

另外,周六的平均车速与工作日并无显著差异,而且周六一天内各时段也没有车速低谷(早晚交通高峰)出现,说明周六还是有不少人在街上活动,是不是周六大家都喜欢出门聚会、逛街呢?还是有些事只有周六才有空去办?数据表明,一周中只有周日的车速比较空,路上比较空,看来对于上海这座城来说,只有周日才是真正的休息日啊。

- 秘密4 -

凌晨在岗司机多在车内休息

数据中有个好玩的现象,白天的时候不管什么时段都有30%左右的出租车车里有人(哪怕仅有司机一个人)、且为“营运”状态,但车速是零。这可能是因为不管什么时候总有30%的车辆在等红灯,毕竟每个十字路口总是一半车辆通行的同时,另一半车辆必须停下等待。

晚上23点以后,这个占比会大幅升高,在凌晨4:08的时候,达到峰值95%。也就是说,凌晨会有很多司机坐在车内,把车顶的灯调成“营运”状态,然后停靠在某个地方休息。据了解,在车内休息的原因是司机想等待附近想乘车的乘客前来敲窗询问。而把顶灯调成“营运”状态是因为司机不想半夜被电话调车中心打扰:电话调车中心会联系“待运”车辆,司机并不想半夜被调度到老远的地方接一个不知道要去哪里的客人。

- 秘密5 -

司机凌晨多停靠在宝山区

那么出租车司机会把车停靠在哪里呢?上图是根据数据绘制的出租车夜间停靠示意图,越红越亮的点说明停靠的出租车越多。可以看到,虽然到处都会有出租车停靠,但宝山区是半夜出租车停靠的热点区域。据业内人士称,很多出租车司机就居住在宝山的顾村、淞南一带,也许他们上夜班的时候就喜欢在家附近躺在车里休息。

以上只是对出租车数据的初步探索,后续还会和房地产数据、地铁数据结合分析,挖掘上海这座城市更多的秘密。如果你对于出租车数据有不同的看法,或者知道一些内部消息,欢迎关注后在下方留言与众读者分享!

- 本期责任人 -

撰稿+数据可视化:沈雨潇

大数据平台支持:陈超

视觉设计方案支持:张岑

END

投稿和反馈请发邮件至holly0801@163.com,谢谢!

本文分享自微信公众号 - 大数据(hzdashuju)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-12-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 什么是机器学习?有哪些算法和分类?又有哪些应用?看完你就懂了

    导读:本文从大数据的概念讲起,主要介绍机器学习的基础概念,以及机器学习的发展过程,用一个形象的例子讲解大数据生态中的机器学习,并按照传统机器学习(包括分类、聚类...

    华章科技
  • 入职一年后,一位算法工程师给初学者的一封信

    导读:本文是澳大利亚机器学习工程师Daniel Bourke写给同行及新人的一封信,总结了12条工作中的经验和心得体会,希望对你有所帮助。

    华章科技
  • 什么是机器学习?有哪些应用?终于有人讲明白了

    导读:人工智能的快速发展,带动了相关技术的繁荣。近些年,国内外的科技公司对机器学习人才都有大量需求。怎样入行机器学习?本文带你从0开始学起。

    华章科技
  • Xshell不能连接SSH的解决

    异常处理汇总-服 务 器 http://www.cnblogs.com/dunitian/p/4522983.html 异常处理汇总-开发工具 http:/...

    逸鹏
  • 例说 Constraint Layout(三)—— 性能测评

    在各种页面设计下,提升有多有少,但 CL 的性能确实是最佳的!

    天天P图攻城狮
  • 区块链技术公司谈V神称区块链的方向

    “2018第四届区块链全球峰会”上,以太坊创始人V神称,他将提出新的方案——"自由激进”的资源分配机制,并将其运用于二次方投票、哈信伯格税、频繁批量拍卖、组合拍...

    用户3031714
  • 分布式任务管理系统 Celery 之三

    前面一篇文章 分布式任务管理系统 Celery 之二 以工程实践为例进行深入学习Celery,介绍工程中Celery的配置结构,调用方法,定时任务相关知...

    用户1278550
  • 成长的烦恼 怎么解决云计算风暴?

    云计算目前已经开始逐渐的被越来越多的企业用户采用。但是随着越来越多的应用部署在云中,云计算风暴也开始困扰着客户。 云计算风暴有时也被称为“启动风暴”,或VDI启...

    静一
  • 未在本地计算机上注册“Microsoft.Jet.OLEDB.4.0”提供程序

    1.使用OLEDB读取Excel,本机调试正常,但是部署IIS上后,当点击按钮时,按钮变灰,系统也没捕获异常。

    _一级菜鸟

扫码关注云+社区

领取腾讯云代金券