数据分析工作中数据异常常见原因归纳

先祝各位大朋友儿童节快乐!

随着数据分析类工作越来越受重视,数据处理、数据统计已经成为日常工作中必不可少的一个环节。

一些朋友会问到,如何避免数据分析过程中出现统计错误的情况,毕竟如果最后把错误的统计数据汇报给领导或客户,会对领导判断或者是业务发展带来误导。

小白

如何避免统计出错呢??

Here we go

在我们知道数据异常或者是统计有误的情况下,又该如何去查找错误原因,根据我在近几年工作中的总结,我认为可以从三个方面着手排查。

01

首先要确认数据源是否有误,即如果数据出处都有问题,那最后得到的数据自然是经不起质疑的。

假如说现在要做一份周报或者月报表,数据是从数据库中导出,如果从数据库中导出的数据都是有问题,那最后在报表呈现的数据自然也是不准确的。

02

其次是统计口径或者说业务逻辑。统计口径包括两个方面,数据分析人员先是与业务人员对接,梳理业务人员数据需求,然后是把梳理后的数据需求与运维人员,即负责数据库维护的同事,进行沟通,把业务需求转化为运维同事能够理解的指标或字段。

如果相关人员对统计指标的理解不一致,最后给出的数据不能说错,但可能就不是初始想要的数据。

上述情况中,数据分析员在中间就起着很重要的作用,能不能把业务语言准确的转化成数据库语言至关重要;而假如省去了中间数据分析员,业务人员直接与运维人员沟通,这种情况下就非常考验双方的沟通技巧、沟通能力。

03

数据源没问题,统计口径也一致,最后的统计结果还是有偏差,这个时候最大可能犯错就是具体的数据统计过程中的错误,比如说是不是函数公式中选定的区域有误,或者是看错行,都有可能造成统计偏差。

数据分析工作中,细心是必不可少的,一般来说,在做好一份报表或报告后,反复检查其中的数据,确认数据都没问题后,再汇报给领导或客户。好的工作习惯就是在一件件不起眼的小事中养成的。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180601G1XEWR00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券