数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析的目的有多种,概括起来有三种:现状分析、原因分析、预测分析。现状分析简单来说就是告诉你过去发生了什么。原因分析简单来说就是告诉你某一现状为什么发生。预测分析简单来说就是预测未来会发生什么。
数据分析主要有六个过程:
数据分析可以通过工具,也可以通过代码来实现。以下分别列出这些常用的:
两者没有好坏之分,只有合适之分。数据分析总体来讲有两个模块,一个是数据处理,一个是可视化。如果数据已经经过处理了,并且手头上的软件可以直接非常方便的做可视化处理,那么我们用软件实现就可以。如果数据没有经过处理,那么最好通过python或者r对数据进行有一些处理,然后再通过软件可视化。或者软件的可视化无法满足我们的要求,那么可以通过代码来实现。总而言之,工具功能无法100%的满足你的要求,但是效率高。代码做数据处理比较好,最数据可视化比较繁琐,但是DIY属性强!