关于数据分析的三个重要步骤

描述性分析:确定所发生的事情,这通常涉及到描述发生了什么现象的报告,通常当我们需要对一个事件或者一个情况进行数据分析的时候,我们需要收集与此相关的数据,当我们刚拿到数据的时候,会显得杂乱无章,这个时候就需要我们分门别类进行统计。统计出的数据就能看出数据之间大致的关系,虽然不能准确的说明其中的原因,但是当我们拿出一个陌生的数值放入该统计模型的时候,我们就知道该数值是否适应这个统计模型。如果我们想要更深一步了解数据模型的内在关系那么我们就需要进行特征分析。描述分析更多是描述一种已经形成的现实情况,在这种情况下,从不同的角度看数据会有不同的解答。

特征性分析:解释现象发生的原因,根据数据挖掘技术来找到数据之间的相关性。要做特征分析的前提在于确保我们所收集的数据的可信度,如果数据源不可信,做出来的数据分析报告肯定也是失实的。同时还可以存在一个问题,在于,我们进行特征分析的时候,如果分析人员本身的思路或者对问题的理解产生偏差后,在选取数据类型时出现选取错误,这样做出来的数据分析报告会出现两种情况,第一种情况在于做出了错误的判断,第二种情况在于,做出的结果并没有错误,但是该结果对于我们想要得到的原因而言是有很大的差距的。

特征分析是数据分析中很关键的一步,当我们做好了特征分析后就需要进行数据分析最有价值的一个步骤上了,那就是预测性分析。

预测性分析:评估可能发生的事情的概率,根据你的工作性质,个人兴趣,做人物画像。数据分析给出的答案通常并不是一个确定性的答案。而是一个加权后的数据模型。为什么会存在这样的情况呢,原因在于,世界的不确定性,是极其复杂的,带有很强随机性的,以及各种可预测及不可预测的干扰项太多,每一个小的变化都导致结果的大的变化,类似于蝴蝶效应,这也正是这个世界的迷人之处。那我们做预测性分析的时候,更多是在一个随机性的世界做一个相对确定性的分析及预测。这样就需要一个相对稳定的数据模型,但是这个数据模型只是在一定程度上能实现一样的结果,也可能出现不一样的结果。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181024A0PK3V00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券