前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >使用Python可视化图表分析行程数据

使用Python可视化图表分析行程数据

作者头像
jeanron100
发布于 2021-10-14 08:08:30
发布于 2021-10-14 08:08:30
9630
举报

这是学习笔记的第 2381篇文章

最近一直在想怎么分析一下个人的行程数据,看看能够从行程数据里面分析出点什么来。最开始我的期望还是蛮高的,有如下的一些预期:

  • 根据出行时间范围,可以基本确定他的生活节奏,工作强度
  • 能够通过行程时间范围来猜测汽车尾号
  • 根据出行的耗时历史来建议出行时间

如果能够分析得到这些信息,感觉还是蛮有意思的,于是开始自己动手,第一个问题就是数据源,导航软件目前还不提供行程数据的导出,所以我是把7-8两个月的行程数据逐个照着导航行程整理出来了,大体的数据情况还可以,不过其中有些数据做了额外处理,比如时间的处理,因为是如果是7:15,那么按照数字化显示就不能是7.15,而更合理的显示是7.4,还有行程时间,比如1:30,是需要统一按照分钟90分钟来整合的,整理后得到的数据如下:

首先我按照时间做了对行程的耗时做了分析,结果发现这个数据似乎不大理想,本来预期是比较稳定的,还打算按照这个数据做下预测。

这种情况下就得换一个思路了,先看看数据的整体分布,使用条形图其实是不好体现数据的分布情况,因为有些行程之间是没有直接关联的,比如早上和晚上的行程,因为时间的差异,条形图的模式反而会有很大的抖动。

如下是按照行程的耗时分布图:

如下是行程出发时间的分布情况,基本上来说都是在6:30~7:00之间开始出发,晚上基本在20:00左右返程。

如下是按照周一到周日的行程耗时分布,可以明显看到周二的行程分布要少很多,还不如周六,周日的多,所以从这一点是可以猜出来很可能是因为限号。

当然前面提到了两个指标,一个是行程耗时,一个是出发时间,还有一个是路程,因为路程和耗时两者是有一定关联,但是折算下来一个折中的指标就是平均速度。所以按照平均速度的分布情况来看,周一和周五是最堵的,相对周四和周六是最通畅的。

我们区别于一般的可视化,引入箱线图,可以看到平均行程的耗时在45分钟左右,区间基本在30-60分钟之间。

其实数据分析到了这里,还是有很大差异的,虽然或多或少的分析出来了一些内容,但是有些指标还是没有充分使用到,而且显示的指标情况还是不够清晰,所以打算使用seaborn进一步做下调整。

如下是行程距离,行程耗时和星期数的综合分布图。

如下是星期和行程耗时的分布图,相比之前的分布图来说会更加清晰一些。

我们继续引入平均速度,出发时间和星期数进行关联,可以看到整个行程会有明显的分水岭,早间和晚间基本堵是工作日,而其他的时间基本都是周末。

而要进一步探索这些数据指标间的关联,就需要引入略复杂的图PairGrid,可以把多个指标都放入,可以生成多个维度的分布图。

接下来需要对数据的指标情况进一步分析,引入检验和预测的功能。

各大平台都可以找到我

  • 微信公众号:杨建荣的学习笔记
  • Github:@jeanron100
  • CSDN:@jeanron100
  • 知乎:@jeanron100
  • 头条号:@杨建荣的学习笔记
  • 网易号:@杨建荣的数据库笔记
  • 大鱼号:@杨建荣的数据库笔记
  • 腾讯云+社区:@杨建荣的学习笔记
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-10-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 杨建荣的学习笔记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
图表分析2020年和2018年北京积分落户数据
一年一度的积分落户工作马上要开始了,刚好对于2020年的分数情况还做了一些统计,总体的感觉就是:水涨船高。
jeanron100
2021/04/22
8750
图表分析2020年和2018年北京积分落户数据
数据库环境标准化管理的初步规划
一般来说,业务能够稳定运行,大家主要聚焦的是线上环境的管理,相反对于其他环境的管理不够重视,而现实情况是这些环境的管理更需要标准化,通过统筹管理减少一些潜在隐患,才能在一定程度上减少线上环境的隐患。
jeanron100
2021/06/09
4800
运维开发体系升级的思考
在大概4年前,我们算是从0到1的构建了现在的数据库运维开发体系,这个过程有较长的启动周期,从我个人主导到后来的成员独当一面,从零星的功能建设到现在有了相对体系化的建设,现在想想真是不易。
jeanron100
2021/09/02
6020
挑战碎片化经验的实现路径
想必到了一定年龄之后,应该沉淀的就是方法论和思维模式了。原本的一些碎片化经验在这个阶段开始受到了很大的挑战,甚至会有深深的怀疑。
jeanron100
2021/09/24
4350
对MySQL报警的一次分析处理小结
Metric:mysql.innodb_row_lock_waits Tags:port=4306,service=xxxx diff(#1): 996>900
jeanron100
2021/04/02
5080
职级晋升ppt中常见的一些小问题和改进建议
这是学习笔记的第 2423篇文章    关于职级晋升的ppt内容,自己也看过不少同学和行业内朋友的,也提供了一些改进的建议,自己这两天做了下总结,还是希望能够对大家也有一些帮助,当然提出问题容易,实际情况和我所说的会有一些差别,大家也不要对号入座,本质上是希望能够提供一些改进建议。我的改进建议分为基本规则、内容格式、内容形式和锦上添花四个类别。 一、遵守基本规则  1. 不使用统一的ppt模板 除非自选的模式效果很突出 2. 随意调整目录结构内容 比如目录结构包括4部分,自己调整为3部分 3. 答辩超
jeanron100
2022/06/07
1.5K0
职级晋升ppt中常见的一些小问题和改进建议
移动端接入数据库故障自愈的初步实现
对于节假日,难得的假期,尤其是外出的时候碰上几个数据库报警,那些报警又属于不得不处理的时候,真是让人上火,所以也想了一些办法来尽可能杜绝和避免这种情况。
jeanron100
2021/04/02
3980
数据库年度规划工作的方法论
春天来了,也到了新的财季,新的年度规划也要开始了。我相信很多同学都会有一种茫然的感觉,一年到头有做不完的事情,同时也感觉规划和实际落地会有很大的差距。
jeanron100
2021/04/22
5480
数据库年度规划工作的方法论
从生命周期的角度来规划数据库运维体系
最近在和团队规划OKR目标的时候,我们讨论了很多问题,我先抛砖引玉,列举了一些现有的问题,打算按照推导的方式:
jeanron100
2021/01/13
1.2K0
一种探索中的学习方法:自己和自己对话
最近调整了下作息,基本上8:00就到公司了,简单整理完,还剩下差不多一个半小时的时间,这一个多小时是尤其重要的,坐在工位上不算是一个封闭的空间,而且在电脑前的思考其实还是比较受限,于是我最近在尝试一种新的学习模式:自己和自己对话。
jeanron100
2021/09/24
3910
MyCAT和MySQL服务能力的对比梳理
今天下午对比了下MyCAT,MySQL和其他数据库的能力项对比情况,梳理了一个列表,因为篇幅原因,主要包含如下的一些能力项。
jeanron100
2021/10/14
1K0
MyCAT和MySQL服务能力的对比梳理
盘点下这些年来改变自己的一些重要时机
这是学习笔记的第 2421篇文章   有时候想起一些工作和生活中的改变自己的机会还是蛮有意思的,绝对不是标榜所谓的成功,因为我远远达不到,仅仅是对我个人来说,回过头来看这些转折点都很偶然,有些场景到现在都难以关联起来,但是结果就是如此。所以,我觉得我们工作中不要有太强的功利性,需要多一些耐心,保持好奇心。    比如我2009毕业后工作的第一家公司,是在一个社会招聘会中碰到的,当时大环境不好,就业形势还是比较严峻的。我在诺大的会场中转来转去,没有方向,基本都是一些偏技术支持的岗位多一些,当时这家招聘的要
jeanron100
2022/05/27
2410
盘点下这些年来改变自己的一些重要时机
从作者的角度去阅读一本书-一种全新的阅读体验
最近在尝试和探索的新的学习方法,总体的感觉效率还是蛮高的,至少能够在短时间内有比较多的思考和产出,最近几天在进行类似的尝试,就是快速去阅读一本书,我的角度相比比较特别,我来简单阐述一下。
jeanron100
2021/09/24
3920
最近在琢磨的一个问题和我的尝试
这是学习笔记的第 2409篇文章     最近在琢磨一个问题,那就是我们每天上下班的路上会接收大量的信息,但是经过时间的沉淀之后,能够留下来的信息是少之又少,这一点让我很焦虑。      像开车上下班的路上,我有时候会听一些访谈和解读,带给我最大的收获是听起来有道理,但是要让我说个一二三,就感觉词穷了,而过了一段时间之后,其实这种听的效果跟没听没什么差别。     对此我做过一些尝试,比如我在路上听《冬吴同学会》,会听个大概,等到公司之后的时候就会找一下相应的文字版,从大段的文字中找到要点和观点,但是这种
jeanron100
2022/03/17
2970
节假日处理数据库集群异常小记
这是学习笔记的第 2403篇文章   今天还在假期状态中,大概在10:30左右的时候,收到一条短信报警,提示一个数据库集群的中间件内存报警了,但是不到1分钟的时间,就提示报警恢复了,但是在11:00左右的时候,接到了研发同学的反馈,说这个数据库集群的只读服务貌似有些问题,想让我帮忙看一下到底有什么问题,整个集群的架构模式类似下面的形式,现在提示是黄色部分的只读数据库中间件有问题。   因为节前也做了巡检,而且这个只读服务已经运行了很长时间了,差不多有3年以上,所以我对于这个问题的初步印象是数据库中间件异
jeanron100
2022/03/03
6920
职场老鸟需要提升的四个方面
这是学习笔记的第 2411篇文章  今天和同事在聊天的时候,我们谈到了一个有意思的问题,那就是对于工作的业务价值和技术价值的衡量。具体的维度和考量就不细说了,大体的意思有两点:首先是不要什么事情都需要上纲上线,时间长了难免会焦虑,都想往价值上去靠,挖空心思包装自己的说法,会更让自己陷入迷茫之中;第二是得有一个轴,也就是我们在一段时间里做事情,一定是有轻重缓急,那么这个核心的轴我们得把握中,而且得把握平衡,否则就是撒芝麻,没有轻重,全是碎片化。 同时在我的观察中,我发现很多职场老鸟都在如下的几个方面存在或多
jeanron100
2022/03/31
2780
职场老鸟需要提升的四个方面
最近解决的两个拖延数年的问题
这是学习笔记的第 2430篇文章   最近一段时间解决了两个持续了多年的问题,想起来感觉自己还是挺蠢的。    第一件事情是关于邮件的,之前公司都是使用Outlook来管理邮件,我一般会把邮件归档下来,生成.pst文件,时不时能够回味下工作中的一些事情,也是一种难得的回忆。我们现在一直在用Foxmail,所以要把Outlook中的.pst文件导入到Foxmail就好像是一座大山摆在我面前,首先我尝试下载Outlook,结果因为版权的事情而无奈放弃了,其中还有很大的一部分原因是我尝试安装貌似和WPS冲突而导
jeanron100
2022/08/29
6360
最近解决的两个拖延数年的问题
灵魂2问12答:DBA的核心价值和最重要的能力是什么?
记得自己在去年的时候私信问了一些朋友关于DBA核心价值和最重要的能力的问题,听到了很多不同角度的思考和反馈,今天整理了下,时隔半年,也算是完成了一件心头的事情。
jeanron100
2021/06/09
8460
维护之夜,说点故事和经验
人内心的默契就是这样,今天要写的标题和几年前一模一样,干脆在原来的基础上做一些补充。
jeanron100
2021/04/23
4140
关于周期的思考和建议
今天脑海里蹦出了一个词“周期”,对的,周期。我觉得好像是一只无形的手,像是路口的红绿灯,路边的指示牌,能够通过这些规则的变化让交通秩序稳中有序。
jeanron100
2021/04/02
5070
相关推荐
图表分析2020年和2018年北京积分落户数据
更多 >
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文