大数据时代的数据治理与企业信息模型
摘要:随着企业信息化水平不断发展,积累的数据也呈爆炸式增长,企业如何通过数据治理,将数据转化为企业真正有价值的资产,已成为亟待解决的课题。本文主要从企业公共信息模型角度出发,分析公共信息模型在大数据时代解决数据治理工作面临的新问题方面发挥的重要作用与价值。
一
大数据时代的数据治理
随着信息技术的不断发展,近些年来,大数据开始蔓延到社会的各行各业,从而影响着我们的生活、工作、生活以及社会的发展,我们已进入大数据时代。
在大数据时代,海量的数据成为企业最具价值的资产,数据的质量决定了资产的质量,通过数据治理提升数据质量是企业大数据建设的基础。传统的数据质量关注数据准确性、完整性、唯一性和规范性。但是随着企业信息化及大数据技术的发展,收集的数据的种类、数量、尺度等有了质的飞跃,数据的来源越来越多样化,数据量越来越大,对于数据融合提出了越来越高的要求。此时,不仅仅需要关注单个系统或洗液内部数据的数据质量,而是需要站在整个企业的角度,整合企业内外部数据,让其发挥价值。我们在关注传统数据质量指标的基础上,更应该关注数据的关联性和一致性。数据具有高的关联性和一致性,我们才能将企业的内外部数据整合为一个整体,否则不同部门、不同系统,内外部数据之间形成了数据孤岛,企业级的大数据系统建设就无从谈起。
提升企业数据的一致性和关联性,满足大数据时代对数据质量的新要求,是我们锲而不舍追求的目标。公共数据模型的建立和应用是提升数据一致性和关联性的重要手段。它不仅仅能够指导对已有数据质量的改善,而且通过模型从数据产生的源头上提升数据的质量。
二
企业信息模型与主数据
企业信息模型是一个抽象模型,描述企业中与生产、运营有关的主要对象的逻辑结构和关系的模型,最终落地为数据库模型。它形成统一的企业信息视图,用于指导业务应用系统的建设、数据的集成共享以及大数据系统的建设。
主数据是企业信息模型的重要组成部分,是指系统间共享数据(例如,客户、供应商、账户、组织部门、项目编码、资产编码等相关数据)。与记录业务活动、波动较大的交易数据相比,主数据(也称基准数据)变化缓慢。
三
企业信息模型在数据治理中的应用
数据模型是数据治理的基础,对于企业来说,构建统一的信息模型标准,相当于建立了一套通用语言,更利于系统与系统、系统与人、人与人之间达成一致理解和交互。主数据是不同系统之间数据关联纽带,比如只有在全企业统一资产编码的基础上,才能实现跨系统、跨部门的资产从采购到报废全寿命的管理。
企业信息模型典型应用场景如下图所示:
新系统建设:正所谓“好的开始是成功的一半”,如果系统从一开始建设就注重遵从标准规范,打好数据设计、定义和标准化基础,将极大降低后续数据治理成本。新业务系统开展数据架构设计过程中,应充分参考企业信息模型,优先直接复用模型成果,针对不满足的业务属性进行继承扩展,在企业范围内保证各信息系统数据的一致性。
系统间数据交换:在系统间应用集成和数据交换时,基于企业信息模型,统一定义数据交换的格式(如主数据),提高数据交换效率。
大数据系统建设:从已建业务系统源端采集数据到大数据平台目标端的过程,一方面是目标端的大数据平台需参考企业信息模型构建数据仓库的库表结构,另一方面在清洗转换过程中的数据检查规则和数据转换规则需依据企业信息模型制定。同时以主数据作为纽带,实现不同系统间、内外部间数据的整合。
四
总结
从以模型作为驱动,从数据模型开始做数据治理,落地在新系统建设、数据集成交换、数据清洗转换的过程当值,站在企业整体的角度考虑数据质量,最终满足大数据时代多元数据融合对数据治理集成性与一致性的要求。
北京睿力科技有限公司
长按下方二维码关注我们
一家致力于大数据2.0时代的知识开发与运营的服务提供商,专注于挖掘数据内部的深层关系,采用知识图谱、深度学习等技术手段构造了一体化的数据分析平台,并创造性的将云计算、图计算、流计算等多样化的计算方式熔于一炉,打造了拥有自主知识产权的“数据云图”产品。公司核心团队均来自国内知名央企及大数据、云计算企业,平均工作年限超十年,拥有包括规划、设计、建设、运维运营等在内的IT全生命周期实践能力,目前服务的对象有电网、发电、城管、社区等一系列价值客户,帮助他们深入挖掘数据价值,实现数据“激活”。
领取专属 10元无门槛券
私享最新 技术干货