本期话题讨论:如何衡量一张或者多张数据表的价值?
如上,是居士最近看到小伙伴们讨论的一个问题,一些朋友也问过类似问题,因此发出来给大家来讨论,本文是将大家的讨论汇总成文,同时在末尾加上居士自己的理解。
数据表的价值,要看是给谁看的。如果只是小白为了出报表凑数据,那价值就是帮助别人添花,如果是给懂数据和逻辑的同事看,而且能够层层递进直到触及问题根源,那价值就很大。同样是转化率,一个页面的转化率和一个登陆模块的转化率,就有很大的价值区别。总结一下,价值要看人看事儿。
先定义低价值的特征可能会更简单一点,至少长期不被使用的表或字段,可以认为是低价值的,这应该是毫无疑问的。
最简单的指标就是字段在单位时间内被查询的次数
需要结合他的使用对象,在整个数据链条中的位置来看,不同的角度对于价值的定义及看重程度都是不同的。对于业务人员来说就是它对于需求满足的程度,对于技术方来说则关注他的引用次数和复用度。最好的当然是不同的思维相结合,一步一步一点点的把复杂的业务场景问题拆解反映到数据上
经营分析类报表还是以业务使用情况来评判,比如单位时间内的查看次数;非经营分析类(比如我们保险行业合规类)我们一般会推送到各系统中,这种需要看从各业务系统调用情况看
整体来讲,居士的意见和讨论3比较接近:
然后,从另一个角度来看,单纯看表的价值,其实已经会比较被动了,这也是数据仓库同学经常会面临的问题,因为不管再怎么考核,这些表离业务价值还是太远了。
所以脱离表的角度来讲,可以多从其它角度思考,比如:
离业务越近,越容易体现价值。