
昨天和一个做数据分析的朋友聊天,他苦着脸说:"我天天加班做报表,BI大屏做得花里胡哨,结果业务部门看都不看一眼,老板还说我做的数据分析没价值。你说气不气人?" 我问他:"你那些数据从哪来的?" 他支支吾吾:"从各个系统导出来的啊,ERP、CRM、财务系统..." 我瞬间明白了。这不是数据分析的问题,这是数据本身的问题。就像你要做一桌满汉全席,结果菜市场的菜都是烂的、脏的、缺斤少两的,你手艺再好也没用。

现在的企业有个很奇怪的现象:人人都知道数据重要,老板张口闭口数字化转型,IT部门砸钱买各种BI工具、AI算法,数据分析师加班加点做各种报表。
但实际呢?
数据质量问题一塌糊涂。
我见过一个电商公司,用户地址栏里写着地球、火星的都有,联系电话一栏竟然有请勿骚扰;制造业的库存数据,生产日期比入库日期还晚;零售业的销售数据,负数销量、999999的异常价格随处可见。
更有意思的是,这些问题大家心知肚明,但没人愿意捅破这层窗户纸。
就像《皇帝新装》里那个小孩没出现之前,所有人都装着能看见新衣服一样。
业务部门心里想的是:"这数据肯定不准,但我又不会分析,就这样吧。"
IT部门想的是:"数据质量差又不是我的问题,工具我都给了。"
老板看着一堆花里胡哨的图表,觉得很高大上,其实全是垃圾进垃圾出。

很多人以为数据质量差只是影响分析结果,其实它的危害远不止于此。
最直接的,是决策失误。
我有个客户,做连锁零售的,每次看销售报表都发现某个区域业绩特别好,老板一高兴就加大投入。
结果后来发现,那个区域的数据采集系统有bug,把退货数据都算成了销售。等于老板拿着错误信息在做商业决策,这不是找死吗?
更深层的,是信任危机。
当业务部门发现数据分析结果经常和实际情况不符时,他们就不会再相信数据了。我见过最极端的例子,一个公司的销售总监直接跟我说:"你们的数据分析我就当个参考,我有自己的判断。"数据分析师辛苦做出来的东西,被当成了废纸。
最隐蔽的,是机会成本。
数据质量差意味着你永远只能做马后炮的分析,无法做前瞻性的预测。就像一个人戴着墨镜开车,你能看见什么?

要解决这个问题,核心不是买更贵的BI工具,不是招更牛的数据分析师,而是要从数据治理开始。
数据治理听起来很高大上,其实就是要建立一套规则,让数据从源头就是干净的、标准的、一致的。
这包括几个方面:
首先,要统一标准。
什么叫客户ID?什么叫订单状态?什么叫收入确认时点?这些必须有一个统一的定义,不能各部门各说各话。就像我们说话要用同一种语言一样,数据分析也要用统一的数据字典。
其次,要建立质控机制。
数据录入的时候就要校验对错,发现异常要及时预警,而不是等分析的时候才发现问题。就像食品安全一样,不能等到吃出问题才去检测。
最后,要明确责任。
数据质量出了问题,到底是谁的责任?
IT部门说业务录入有问题,业务部门说系统设计有缺陷。
这种踢皮球的事情,必须有人拍板定责。
数据驱动不是口号,是实实在在的能力。而这个能力的根基,就是数据质量。
一个真正有数据思维的企业,不会整天炫耀自己有多少数据、用了什么先进算法,而是会先把数据整理得井井有条、干净标准。
因为他们明白一个道理:垃圾进,垃圾出。脏数据做不出好分析,坏数据得不出真洞察。
数据分析师的价值,不是会用什么工具,而是能基于干净的数据,给出有价值的商业洞察。而要实现这一点,从数据治理开始,这是一条绕不过去的路。
那些还在为数据分析价值而困扰的企业,不妨先问问自己:我们的数据质量怎么样?如果这个问题都回答不上来,那就别谈什么数字化转型了,先把基础打牢再说。