专栏首页科学Sciences数据资源常识(3.2)数据治理(Data Governance)

数据资源常识(3.2)数据治理(Data Governance)

第二篇《数据资源概观》数据资源类型

A.数据资源(Data Resource)常识 三、行业数据资源概念(Industry Data Resources Concept)

3.1 数据管理(Data Management)

3.2 数据治理(Data Governance)

3.2 数据治理(Data Governance)

数据治理(Data Governance)作为数据管理的其中一个核心职能,是对数据资产管理行驶权力和控制的活动集合(规划、执行和监控),指导和其它数据管理职能如何执行,在高层次上执行数据管理制度。(DMBOK1.0, 2014) [14]数据治理正在不断发展,与众多新兴学科一样,目前数据治理存在多种定义,各大机构对数据治理的定义,如下表所示:

表2. 各大机构对数据治理的定义一览表

机构名称

数据治理相关定义

DGI

数据治理是一个通过一系列信息相关的过程来实现决策权和职责分工的系统,这些过程按照达成共识的模型来执行,该模型描述了谁(Who)能根据什么信息,在什么时间(When)和情况(Where)下,用什么方法(How),采取什么行动(What)。(The DGI Data Governance Framework) [15]

IBM

数据治理是一门将数据视为一项企业资产的学科。数据治理是针对数据管理的质量控制规范,它将严密性和纪律性植入企业的数据管理、利用、优化和保护过程中。它涉及到以企业资产的形式对数据进行优化、保护和利用的决策权利。它涉及到对组织内的人员、流程、技术和策略的编排,以从企业数据获取最优的价值。(Building the data warehouse W. H. Inmon) [16]

DMBOK

数据治理(Data Governance, DG)是指对数据资产管理行使权力和控制的活动集合(规划、监督和执行)。(Khatri V, Brown CV (2010). Designing data governance) [17]

COBIT 5

COBIT 5中给出的不是数据治理定义,而是信息治理。因为这两个术语实际上是同义词,所以可采用COBIT5的信息治理定义作为数据治理定义。(Weber K, Otto B, Oterle H (2009). One Size Does Not Fit All---A Contingency Approach to Data Governance) [18]信息治理(Information Governance, IG)包含以下三个方面的内容[ISA13]:(1)确保信息利益相关者的需要、条件和选择得到评估,以达成平衡的、一致的企业目标,这些企业目标需要通过对信息资源的获取和管理实现;(2)确保通过优先排序和决策机制为信息管理职能设定方向;(3)确保基于达成一致的方向和目标对信息资源的绩效和合规进行监督。

百度百科

数据治理是指从使用零散数据变为使用统一主数据、从具有很少或没有组织和流程治理到企业范围内的数据治理、从尝试处理主数据混乱状况到主数据井井有条的一个过程,并最终使企业能将数据作为企业的核心资产来管理。

学术文献

(1)数据治理是指企业数据管理的决策权和相关职责的分配。(2)数据治理是一个用于明确企业数据使用的决策权和职责分工的结构化框架。(3)数据治理是指企业数据资产的决策权分配。(4)数据治理是金融机构对有效数据产生影响的人员、过程、技术应用和组织的处理和管控,以确保数据对合理使用者和所有者产生的内涵性、有效性、一致性、时效性、可用性和质量维度。

3.2.1 狭义的数据治理

狭义的数据治理的驱动力最早源自两个方面:一、内部风险管理的需要,包括:财务做假、敏感数据涉密、数据质量差影响关键决策等;二、为了满足外部监管和合规的需要,比如萨班斯-奥克斯利法案、巴塞尔I/巴塞尔协议、健康保险流通与责任法案(HIPAA)等。(DAMS, Jelani Harper, 2017) [19]但随着全球越来越多的企业了解到信息资产的重要性和价值,在过去几年中,数据治理的目标也在发生些转变。除满足监管和风险管理外,如何通过数据治理来创建业务价值备受关注。

3.2.2 广义的数据治理

广义的数据治理是对数据资产管理行使权力和控制的活动集合(规划、监控和执行),指导其他数据管理职能如何执行,在高层次上执行数据管理制度。组织为实现数据资产价值最大化所开展的一系列持续工作过程,明确数据相关方的责权、协调数据相关方达成数据利益一致、促进数据相关方采取联合数据行动,数据治理与数据管理的关系如下图所示:

图3:数据治理与数据管理关系

数据治理的全过程:从范围来讲,数据治理涵盖了从前端事务处理系统、后段业务数据库到终端的数据分析,从源头到终端再回到源头形成一个闭环负反馈系统(控制理论中趋稳的系统),从目的来讲,数据治理就是对数据的获取、处理、使用进行监督(监管就是我们在执行层面对信息系统的负反馈),而监管的职能主要通过五个方面的执行力来保证——发现、监督、控制、沟通、整合。

3.2.3 数据治理的重要性

高质量数据对任何个人和单位都是战略性资产,随着个人私有数据量的增长和企业推进数字化转型的进程,有效数据正迅速成为一个关键的业务差异。要使数据具有价值,需确保数据的可信任、安全性、可访问性、准确性、共享性和及时性。数据治理的目标是共同保证“正确的信息,以正确的形式,在正确的时候,交付给正确的人”。数据简化技术为实现这些目标,制定了内嵌具有数据类型层级关键词的源数据格式,并且多种数据类型划分兼容并存,方便数据溯源和归类,在人事物资等事务处理中提供了极大方便。

在数字经济中,数据治理有助于增强企业灵活性,涉及到企业中所有跨功能和跨业务的决策机制,有效协调才能使相关决策成本和风险最小化。如果缺乏企业决策者支持、系统间数据壁垒、治理项目缺乏明确的流程和数据模板、数据所有权和问责机制不清等因素,会导致项目失败或者治理结果不理想。数据治理具有战略性、长期性、艰巨性、系统性、持续企业内部数据环境优化治理工作,因此数据治理是一个漫长而持续的过程,没有一针顶破天的诀窍,也没有立竿见影的捷径,要避免对数据治理工作粗浅的认识(杨冰伦《论金融机构金融风险管理中的数据治理》,2016)[20]

3.2.4 数据管理与数据治理的区别

围绕数据领域展开的数据管理和数据治理,有很多地方是互相重叠的,因此这两个术语经常被混为一谈。数据管理和数据治理的理念在数据资产管理时深入人心,但是大部分人无法设计有效、高效、简单明了的技术支持方案。此外,每当人们提起数据管理和数据治理的时候,还有一对类似的术语叫信息管理和信息治理,更混淆了人们对它们的理解。而信息管理课题有许多相关子集,包括主数据管理、元数据管理、数据生命周期管理等等,这些相关概念后面说明。[21]

(1)数据管理包含数据治理

数据管理包含多个不同的领域,其中一个最显著的领域就是数据治理。“治理是整体数据管理的一部分”这个概念得到业界广泛认同。CMMi协会颁布的数据管理成熟度模型(DMM)使这个概念具体化。DMM模型中包括六个有效数据管理分类,而其中一个就是数据治理。国际数据管理协会(DAMA)在数据管理知识体系(DMBOK)中也认为,数据治理是数据管理的一部分。在信息管理领域,高德纳(Gartner)咨询公司认为企业信息管理(EIM)是“在组织和技术的边界上结构化、描述、治理信息资产的一个综合学科”。高德纳(Gartner)这个定义不仅强调了数据/信息管理和治理上的紧密关系,也重申了数据管理包含治理这个观点。

(2)治理与管理的区别

数据治理是数据管理的一部分,那么如何定义数据管理。治理相对容易界定,它是用来明确相关角色、工作责任和工作流程的,确保数据资产能长期有序地、可持续地得到管理。而数据管理则是一个更为广泛的定义,它与任何时间采集和应用数据的可重复流程的方方面面都紧密相关。例如,简单地建立和规划一个数据仓库,这是数据管理层面的工作。定义谁以及如何访问这个数据仓库,并且实施各种各样针对元数据和资源库管理工作的标准,这是治理层面的工作。数据管理更广泛的定义包含“数据多样性(dataversity)”上主题为数据管理的文章和博客,其中有一部分是特别针对数据治理的。一个更广泛的定义是,在数据管理过程中要保证一个组织已经将数据转换成有用信息,这项工作所需要的流程和工具就是数据治理的工作。

(3)信息与数据的区别

在上文关于数据管理的COBIT 5定义中,提到了数据和信息的区别。所有信息都是数据,但并不是所有数据都是信息。信息是那些容易应用于业务流程并产生特定价值的数据。要成为信息,数据通常必须经历一个严格的治理流程,它使有用的数据从无用数据中分离出来,以及采取若干关键措施增加有用数据的可信度,并将有用数据作为信息使用。数据的特殊点在于创造和使用信息。例如高德纳(Gartner)术语表中,没有单独解释数据管理和数据治理的概念,取与代之的是重点介绍了信息治理和信息管理的概念。

(4)数据治理主要围绕对象:角色

与正式的数据治理流程相关的角色是有限的。这些角色通常包括高层的管理者,他们优化数据治理规划并使资金筹集变得更为容易。这些角度也包括一个治理委员会,由个别高层管理者以及针对治理特定业务和必要流程而赋予相应职责的跨业务部门的人组成。角色也包括数据管理员,确保治理活动的持续开展以及帮忙企业实现业务目标。此外,还有部分“平民”管理员,他们虽然不会明确被指定为数据管理员,但他们仍然在各自业务领域里的治理流程中扮演活跃的角色。

有效的治理不仅需要信息技术(IT)的介入,这是人们的普遍共识。尤其当业务必须更主动地参与到治理方式和数据管理其他层面(例如自助数据分析)的时候,目的是要从这些工作参与中获益。在更多的案例中,特定领域的治理可以直接应用于业务。这就是为什么治理仅需要IT的介入是一个过时且应该摈弃的观点。

(5)数据治理主要围绕对象:领域

数据治理包含许多不同方面的领域:

•元数据:元数据要求数据元素和术语的一致性定义,它们通常聚集于业务词汇表上。

•业务词汇表:对于企业而言,建立统一的业务术语非常关键,如果这些术语和上下文不能横跨整个企业的范畴,那么它将会在不同的业务部门中出现不同的表述。

•生命周期管理:数据保存的时间跨度、数据保存的位置,以及数据如何使用都会随着时间而产生变化,某些生命周期管理还会受到法律法规的影响。

•数据质量:数据质量的具体措施包括数据详细检查的流程,目的是让业务部门信任这些数据。数据质量是非常重要的,有人认为它不同于治理,它极大提升了治理的水平。

•参考数据管理:参考数据提供数据的上下文,尤其是它结合元数据一起考虑的情况下。由于参考数据变更的频率较低,参考数据的治理经常会被忽视。

虽然上述提及的是数据治理在数据管理中所负责的特定领域,但一个至关重要的问题在于,所有组织里的数据必须持续坚持数据治理的原则。

(6)数据治理的主要技术:数据建模

数据建模是依赖于数据治理的另一个数据管理中的关键领域,它结合了数据管理与数据治理两者进行协调工作。可以说,为了将数据治理扩展到整个组织,利用一个规范化的数据建模有利于将数据治理工作扩展到其他业务部门。遵从一致性的数据建模,令数据标准变得有价值(特别是应用于大数据)。一个确保数据治理贯穿整个企业的最高效手段,就是利用数据建模技术直接关联不同的数据治理领域,例如数据血缘关系以及数据质量。当需要合并非结构化数据时,数据建模将会更有价值。此外,数据建模加强了治理的结构和形式。

(7) 治理与管理的关键不同点

数据管理其他方面的案例在DMM中有五个类型,包括数据管理战略、数据质量、数据操作(生命周期管理)、平台与架构(例如集成和架构标准),以及支持流程(聚集于其他因素之中的流程和风险管理)。在此重申一点,数据治理和数据管理非常接近是有事实支撑的,数据质量经常被视为与数据治理相结合,甚至被认为是数据治理的产物之一。也许,情景化这两个领域的最好办法,在于理解数据治理是负责正式化任何数据管理当中的流程,数据治理本身着重提供一整套工具和方法,确保企业在实际上治理这些数据。虽然数据治理是数据管理中的一部分,但后者必须要由前者来提供可靠的信息到核心业务流程。(DAMSJelani Harper,2018)[22]

未完待续(To Be Cont.)

本文分享自微信公众号 - 科学Sciences(SciencesPub),作者:秦陇纪

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-04-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 数据资源(Data Resource)常识(1)(2)

    数据资源存储在个人和各种社会单位持有的各种设备上,并且在人类社会的人机交流中流通和应用。本文通过数据资源、数据管理、数据治理、源数据、数据元、大数据、元数据、数...

    秦陇纪
  • 数据(Data)和信息(Information)常识(3)(4)

    百度百科里,数据是一个多义词(共4个义项)▪计算机术语▪汉语词语▪综合性云数据平台▪杂志。其中,

    秦陇纪
  • 数据的分类(Data Classification)常识(1)

    ③定量的,定量数据:反映事物数量特征的数据,如长度、面积、体积等几何量,重量、速度等物理量;

    秦陇纪
  • 3分钟让你分清,数据管理与数据治理的区别

     数据管理和数据治理有很多地方是互相重叠的,它们都围绕数据这个领域展开,因此这两个术语经常被混为一谈。   此外,每当人们提起数据管理和数据治理的时候,还有一...

    BestSDK
  • [数据知识]DAMA数据管理—数据治理

    数据治理是数据管理框架的核心职能,本章重点介绍数据治理职能的定义、相关概念和活动。undefined

    CDO首席数据官
  • 数据管理与数据治理的区别

    当我们谈数据资产管理时,我们究竟在谈什么?就目前而言,我们谈论得最多的非数据管理和数据治理这两个概念莫属。但是对于这两个概念,两者的准确定义是什么,具体区别又...

    小莹莹
  • 老板要做数字化转型,干了3个月的脏活累活,我被开除了

    “数据治理”这个10多年前就已经出现的名称,在最近这几年时间一下子火了起来。不知何时,江湖中流传出了:“数字化转型、治理先行”的说法。

    大数据分析不是事儿
  • 浅谈数据治理、数据管理、数据资源与数据资产管理内涵及差异点(建议收藏)

    随着信息技术的不断涌现和普及,业务发展加快了数据膨胀的速度,行业内衍生了较多的新名词,如数据治理、数据管理、数据资源管理、数据资产管理等名词的定义很多,概念容易...

    木东居士
  • 如何成为一名数据科学家

    用户1737318
  • 从元数据到元数据管理,这篇文章终于讲清楚了

    “元数据管理是企业数据治理的基础”,在数据治理战略实施的时候,这是我们经常会听到看到的一句话。但是,数据治理的概念在国内还并未普及,如何打好数据治理的基础更是一...

    BI数据分析

扫码关注云+社区

领取腾讯云代金券