专栏首页数据化管理企业数据大厦的基础-源头数据
原创

企业数据大厦的基础-源头数据

源头数据是企业数据大厦的基础

2.1.1 企业数据源头

源头数据即是直接从终端采集的数据。该数据可以是主观观察记录的数据,也可以是手动测量记录的数据,还可以是使用智能设备自动采集的数据。源头数据强调其质量,质量越高,未来构建的数据大厦越牢固。

评价源头数据质量的指标有多个,包括数据的真实性、准确性、精确性、完整性、全面性和及时性,在大数据时代,还比较强调源头数据之间的关联和共享,所以还有关联性和开放性,从而形成了评价数据质量的8个指标。后面还会针对数据质量做深度的专业介绍,在此先略过。

在企业数据中,源头数据有两大类,一类是描述企业资源的静态数据,一类是描述资源活动的动态数据,这两类数据关联在一起,形成了相互联系在一起的企业大数据的源头数据。

企业大数据的源头数据大多数情况下是有计划的采集的,与外部大数据的差异在于,外部大数据逐步从Web1.0升级到了Web2.0,实现了UGC(UserGeneratedContent),现在正逐步迈向Web3.0时代,社交媒体上的交互逐渐成为外部大数据的来源,该数据有自动自发、非计划、非结构化的特点。而企业大数据,往往是企业根据规划,主动记录并对所采集的数据进行模式化或者体系化的存储和传输,形成结构相对稳定的数据。

不同行业对源头数据的采集会有不同的规划模型。在生产制造业,聚焦生产过程的数据常常会采用“人、机、料、法”的模式来梳理数据的源头;而零售业则不太强调设备,更多强调销售额;在零售服务业,物料不是关键要素,而是把服务产能当做重要的即时性资源来看待。比如,对餐饮企业来讲,一个座位,如果在吃饭的时间闲置,这个座位的产能在这个时间段就被浪费了,就如火车票一样,一旦列车开走了,旅客没有坐上火车,这个座位的价值就被浪费了。

企业管理源头数据的难点在于基层对数据的管理目标和高层对数据的管理目标不一致。高层希望数据记录更加全面、及时和精准,但一线的员工往往因为记录数据带来了工作量的增加,而额外增加的工作量往往没有实质利益上的补贴,这样就导致了基层员工的抵触。这种抵触可能会导致数据不全面、不准确、不完整、不连续,甚至不真实,因为一线员工为了减少在数据记录工作上的时间消耗,很可能会随便填写。所以,为了保证数据质量,企业应尽可能地采用智能采集设备自动记录数据。

如果企业没有预算采购智能数据采集设备,就需要通过对数据记录工作考核或审查来解决源头数据质量的问题,并增加多方数据校验的工作,以便及时发现数据中的错误。

2.1.2 企业数据地图

一个企业即为一个主体,企业大数据需要将企业所有的相关数据都集合并关联起来。企业的每一个资源以及资源活动都跟企业绑定在一起,其数据记录都是企业的资源活动记录,都能够通过一根线将所有的数据关联在一起。

我们可以想象一下,当消费者购买了企业的一个产品(或者服务),消费者对产品不是很满意,产生投诉。通过产品的编号和批次,就可以追溯到该产品是谁生产的,是哪个班组长带领团队生产的,而生产该产品所用到的零部件是由哪家供应商在什么时间供给的,该供应商是由哪个采购人员开发的,该零部件是由哪个员工找哪家供应商生产的,甚至可以追溯整个链条上的哪位员工,是由谁领导、谁招聘的等,通过一个产品就可以把公司所有的资源都牵引出来。

只要企业的数据系统足够完整,就可以从企业的某一个资源或者资源活动追溯到企业所有的资源,这就构成了一张巨大的数据记录和传输的网。根据网上的每个节点的资源和资源活动数据记录追溯到生产流程的每个环节,这张网就构成了企业的数据地图。这就相当于,地图上所有的道路之间都是连通的,没有孤立的道路,在道路上行驶的汽车,不用“飞”起来,就能够走遍所有的道路,这是一个完整交织在一起的数据网,是完整的数据地图。

如果资源和资源活动的记录数据不全,中间断裂,导致有的资源数据不能同其他的数据关联起来,就把这部分叫作“数据孤岛”。因为“数据孤岛”的孤立性,无法与企业的经营绩效连接起来,从而导致这部分数据变得与企业无关,且没有价值和意义。

企业中与人相关的数据地图与企业整体的数据地图紧密相关。企业中的每一个人都是按照上级指令在行动,如果一个企业中的人没有了上级,就会成为一个孤岛。企业中可以允许有许多级领导,但不允许没有领导的组织节点存在。数据地图也一样,每个企业大数据线中的数据点都必须与企业的资源或者资源的活动直接关联起来,如果无法关联起来,就会形成孤立的数据,变得没有意义。

企业存在的根本目的就是通过输入资源、转换资源、产出产品或者服务以满足客户的需求。从产品或者服务的角度出发来看,所有与这个产出无关的、存在于孤岛上的资源和资源活动都是没有意义的,都是企业可以砍掉的。

如果一个部门或者个人所从事的工作与企业产出的产品或者服务没有关系,这些资源或者资源活动不产出价值,那么他们将会被企业彻底砍掉。

2.1.3 企业数据大厦

企业大数据的源头在基层,基层的业务活动推动了企业资源的转换,从而产出价值。虽然高层在领导基层的工作,但价值的传递是靠基层来完成的。而企业大数据只有基层的源头数据也是不行的,源头数据的量非常大,高层“日理万机”也不可能事无巨细地看那么多数据,因此,数据在向上汇报的时候,必须经过加工处理。

源头数据经过加工之后形成运营数据,反映一定时期的企业运营状况,然后经中层经理的加工汇总和分析形成报表,这一步是判断本岗位运行状况的依据,同时也可以让高层了解本岗位的运行状况;高层获知运营数据后,通过加工、理解、分析、判断,形成支撑自己决策的结论型数据,通常叫作经营数据;公司的最高层领导通过经营数据来判断战略是否正确、是否需要调整等,最终形成了相关的财务指标数据和战略投资决策数据,这个是金字塔的顶端。如下图所示。

处在中间层级的每个领导层对数据进行加工处理,一方面每个领导层可以更好地了解下属层级的相关资源和资源活动,另外一方面可以向上级传达目标的完成情况。这就有了每个层级对数据的加工活动。下级汇报上来的数据是执行数据,即下级执行任务所完成的情况,对下级汇报上来的数据进行汇总整理形成汇报本级工作需要依据的数据,根据下级的完成情况,对本级所能够调动的资源进行调动,从而让产出更大,这一类数据被称做控制数据。本级的工作也需要向上级汇报,通过对下级所汇报的工作数据加工,向上级汇报工作情况和目标达成情况,把这一类数据称做绩效数据。所以,中层管理者每个层级都需要三大类数据:一、基层汇报上来的执行数据;二、本级履行岗位职责所需要的控制数据;三、本级需要向上级汇报的绩效数据。这三类数据统称为运营管理数据,即企业中层管理者为履行本岗位职责所需要的数据。

中层管理者需要向高层汇报,而汇报的数据就是本层级的绩效数据,对各个环节的绩效数据汇总构成了高层决策的依据。高层管理者根据本企业的战略计划、战略目标和经营绩效要求,进行深度分析来了解业务的开展情况。如果业务还有机会,将继续投资该业务,如果该业务已经到了生命周期的末端,则淘汰该业务,或者从公司的战略目标出发,决定该业务是继续投资还是转让。这一类的决策可以称做是企业的经营决策,因此可以把这一类的数据称做“经营数据”,即企业高层对各个业务层面的资源和资源活动记录数据进行深度分析,来决定该业务的发展方向和在公司业务中的定位。

高层决策所依赖的数据背后是对整个公司经营活动的汇总和总结,形成了财务管理上要求的3张关键报表,分别是:现金流量表、资产负债表和盈亏平衡表。这三张报表是根据企业一个时间周期内的具体表现做出的,包括该企业在预定的时间段内所达成业绩的情况,属于动态数据的汇总数据,即在时间节点上的静态数据。高层管理者将根据公司业绩达成情况的静态数据来决定公司对该业务的定位和决策。我们把这类的数据叫作“经营财务管理”数据。财务数据是衡量一个企业某个阶段实际绩效的数据。

在企业的业绩表现面向投资者的时候,需要对经营财务管理数据进一步加工从而得到公司的投资方向、投资偏好、投资诉求等方面的细节数据。而投资者在选择投资对象的时候,也会着眼于企业的经营状况,并通过一定的指标来评价该公司值不值得投资。这些数据就称做金融数据。

2.1.4 企业大数据层级化管理

当构建了企业的数据地图和数据大厦之后,就要对这个数据地图和数据大厦进行维护,就如物业公司需要对一个大厦进行全面管理一样,企业的数据地图和数据大厦也需要精心维护,不仅要保证数据地图的完整性,还需要保证数据大厦的牢固。

在对企业的数据地图和数据大厦进行维护的过程中,层级管理是不可或缺的。我们知道,大厦的地基是源头数据,而采集源头数据又是基层工作者的职责,企业信息系统中的原始数据是否准确与基层的工作分不开,如果他们对源头数据质量不负责任,那么源头数据就不会准确,任何的向上传输都变得毫无意义,甚至是有害的。

为了避免数据失真,企业就需要对数据进行管理,每个层级的数据都需要经过数据校验,保证汇报数据的真实性、完整性和全面性。为了避免利益冲突,企业需要制定一定的制度、流程和监督机制来确保数据的质量。

另外,在完善的制度、流程和监督机制下,数据仍然难以保证得到有效传输。最好的方法是统一归口、统一管理、集中处理,即由数据中心统一集中管理数据。当然这也会带来不了解现场的人在处理数据的时候存在理解偏差的问题,但是当数据的质量和标准得到精细化的完善后,这个问题就不是大问题了。

中国政府已经开始试点“数据统筹局”的管理方式,并有望在不远的将来能够实现数据的全国统筹。虽然这是一个浩大的工程,需要多年的经验积累,但相信这必然是一个趋势。当然,数据的统筹仍然需要各个层级部门开放自己的原始数据,只有做到将数据彻底开放,数据质量才会得到真正的保障。数据的开放不是数据的共享,这是两个完全不同的概念。数据的开放是从数据的源头开放数据,而数据共享的是经过授权或者加工过的数据。开放是敞开了数据的接口,被开放的部门能够直接读取数据,这样读取的就是源头数据,无论是人工读取还是机器自动化读取。

企业的信息系统和自动化数据采集使得数据管理起来更加方便,这种自动化的信息系统将改变企业的组织架构和权力结构,当数据开放之后,权力将只会在合理的范围内使用,滥用职权的问题会得到有效的限制。

2.1.5 企业大数据从IT到DT

“没有记录下来的事情就没有发生过”当我们追溯历史的时候,就需要历史的资料来验证我们的假设,如果没有史料,则无法推测历史。企业大数据也一样,任何人都不可能去分析没有的数据,也不可能把自己对过去的理解定义为历史数据,靠回忆和想象都无法填补历史数据的空白。

现在的数据分析技术还非常有限,特别是对于大数据采集的分析还很少,但发展非常快速。当未来数据分析和挖掘能力得到有效发展并成熟之后,如果没有数据可供分析,这将是非常遗憾的。

无论是什么数据,只要与企业的资源和资源活动相关,在资金实力足够的情况下,能采集记录就采集记录,现在或许没有用,但将来一定会有用的。现在我们处于IT时代,因为硬件和软件技术条件的限制,需要非常谨慎地梳理现有的数据,尽可能做到简便和快速,所以更多的是考虑什么样的数据有用,具有前瞻性的企业在做规划时也只是预计从目前到未来1~3年的时间范围内的需求,导致很多的细节数据未能够得到有效保留。但是,如果进入DT时代,企业就需要大量的历史数据,并且大多数的DT专家—数据科学家也都在找寻、加工、处理历史的数据。

DT时代的观点和IT时代的观点有着本质的差异。DT时代强调数据的广泛性、全面性、完整性和关联性,而IT时代的观点则从实际出发,只分析目前有用的数据。

全文摘自《企业数据化管理变革-数据治理与统筹方案》赵兴峰著

该文转载已取得作者认可

版权说明:版权所有归明悦数据所有,如需转载请联系我们,我们将在第一时间处理,或请注明内容出处(《企业数据化管理变革》赵兴峰著),非常感谢!【往期内容已在(明悦数据)公众号同步发布】

下期内容更实战!

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 数据间关联与追溯

    企业大数据是企业内部资源与相关外部资源的数据集。而企业组织是一个整体,对该组织资源和资源活动进行描述的数据也应该是一个整体,而不应该有孤立的数据。一个企业中的任...

    明悦数据
  • 源头数据采集与智能设备投资

    源头数据是企业大数据应用的基础,也是所有数据分析和挖掘工作的基础。没有原始数据,所有的大数据都找不到依据。很多企业之所以不知道“大数据在哪里呢”,就是因为没有构...

    明悦数据
  • 商业洞察需要的是数据思维!

    商业洞察一直以来都是比较神秘的话题,如何从一堆数据中找到新的商业机会,找到满足客户的需求,在市场数据中找到新的机会点,在过去的数据中找到未来的发展趋势并对未来做...

    明悦数据
  • 【案例】浅谈医学大数据是怎么回事?

    编者按:本文作者陈遵秋,美国俄勒冈州,健康科技大学,公共卫生预防系,美国统计协会认证统计分析师;陈漪伊,美国俄勒冈州,健康科技大学,公共卫生预防系,生物统计助理...

    小莹莹
  • 网站安全公司-数据安全风险分析

    现代信息化系统越来越普遍,但对于数据安全方面却有很多问题,数据完整性风险不仅影响信息的有效性,还影响信息正确性的保证。一些政府条例特别注重确保数据的准确性。如果...

    技术分享达人
  • 大数据社会的十三大具体应用场景

      美国NASA如何能提前预知各种天文奇观?风力发电机和创业者开店如何选址?如何才能准确预测并对气象灾害进行预警?包括在未来的城镇化建设过程中,如何打造智能城...

    腾讯研究院
  • #后疫情时代的新思考#“数 ”战“数”决将成为各行各业的普遍趋势丨数据猿公益策划

    2020年初,突如其来的新冠疫情打乱了正常的社会节奏,全国上下集体投入到了疫情防控攻坚战之中。

    数据猿
  • 安全的陷阱:警惕大数据壁垒化危害

      随着人们对大数据价值理解的深入,更多的公司将自身领域拓展至大数据层面。然而与高速发展相对应的是,数据管理行业急需的一系列数据使用标准及数据守则并没有被建立...

    腾讯研究院
  • 元数据的生死时速

    公司经营分析会提到家庭市场的重要性,我就问负责家庭模型的同事:去年做的家庭结构标签用得怎么样?然后同事给我拉出了下面这张表。

    用户1564362
  • 业界 | 苹果确认收购了一家斯坦福血统的暗数据分析公司

    AI科技评论了解,苹果近日收购了一家数据挖掘和机器学习公司LATTICE(网址Lattice.io)。这家公司的前身是斯坦福大学计算机学院的研究项目DeepDi...

    AI科技评论

扫码关注云+社区

领取腾讯云代金券