前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >实战演练| EDA应用——波士顿犯罪分析

实战演练| EDA应用——波士顿犯罪分析

作者头像
用户1621951
发布2019-08-29 16:22:52
1.3K0
发布2019-08-29 16:22:52
举报

No.1

引入

无论项目还是比赛,拿到一份数据,我们首先需要观测和分析数据,以更好的进行后面的数据清洗、特征工程等工作。本期我们以波士顿犯罪数据分析为例,介绍EDA的思路和方法,应用EDA来分析近几年来波士顿最集中的犯罪时间、犯罪地区以及犯罪频率等。

EDA(Exploratory Data Analysis)指探索性数据分析,主要针对原始数据进行初次分析,以了解数据的分布情况,为后期的特征工程模型选择等做准备。

No.2

波士顿犯罪分析

2.1 调库、导入数据及数据观测

2.2 数据初步分析及缺失值处理

通过生成的mz_table表观测数据缺失情况

根据以下热图可以看出,SHOOTING列缺失值非常多,不便处理,所以我们直接删除SHOOTING列。

2.3 数据处理及增加数据新特征

转换时间显示方式

为方便观测,重命名列名

增加新特征用于后面的时间影响分析

2.4 EDA

观测犯罪与时间的关系

观测犯罪地区和犯罪组织的关系和影响

观测犯罪地区和犯罪月份的关系和影响

观测犯罪组织的危险程度

观测犯罪地区和其他特征的影响以及其他特征的密度分析

可视化犯罪地区

2.5 地理信息分析

在地图上通过热图方式显示犯罪地点

整体图

放大可看具体犯罪地点

换种地图背景来显示

No.3

总结

本期我们以波士顿犯罪分析为例介绍了EDA的简单应用,但别忘了这仅仅是最开始的工作,在实际的项目中,分析完数据还要进行特征工程、模型选择等 。后面我们会慢慢介绍更多的工作,让我们期待下次再见~

参考

https://www.kaggle.com/kernels/scriptcontent/19308157/download

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-08-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据魔术师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档