政务大数据的逻辑模型

政务是个大市场,阿里、腾讯、电信、华为都在赔本赚吆喝。本文作者宇同学是资深从业人士,研发总监,他会写一系列文章来阐述政务云全景。

前面三篇分别深入阐述:

  1. 政务大数据点本质:《 浅谈政务大数据的本质
  2. 政务大数据的全景图:《政务大数据的全景图
  3. 政务大数据的上下文范围:《政务大数据的上下文范围
  4. 政务大数据的概念模型:《政务大数据的概念模型

反响非常好,本篇接上一篇讲讲政务大数据的逻辑模型。希望大家会喜欢!

后续还有一系列文章;敬请期待。

在《政务大数据的概念模型》一文中,重点讨论了政务大数据的业务实体关系,即其外模式(用户视图)。政务大数据的逻辑模型(模式)是基于其概念模型,对其逻辑结构进行数据建模,它重在说明数据之间的逻辑关系。自底向上而言,政务大数据的逻辑模型包括:元数据、主数据和主题数据三个核心部件,数据存储、数据计算和数据服务三个重要层面,数据采集、数据运营和数据管理三个基础体系。

先看政务大数据的三个核心部件。

作为“数据的数据”(data about data),政务元数据服务于政务大数据的采集、标准化、规范化和数据交换。提到元数据,不得不提OMG(Object Management Group)的 CWM(Common Warehouse Metamodel ),即通用数据仓库元模型。CWM定义了元数据的规范、标准,覆盖了关系型、非关系型和多维数据,以及在数据仓库环境之下的其他数据对象。作为基于传统数据仓库理论的元数据定义,在大数据的应用情景下依然适用。在大数据的应用场景下,元数据也依然是重要的标准化组成部件。按照元数据的用途,可分为技术元数据(用于开发和日常管理如控制)和业务元数据(关键业务价值、业务上下文)。前者是运作保障,后者是实质内容。元数据尤其是技术元数据的标准化、规范化程度(数据标准、映射关系和规则)决定了数据的质量,元数据尤其是业务元数据的规划设计水平决定了数据的价值。就政务大数据而言,其技术元数据支撑着政务应用体系的开发规范和控制模型,业务元数据支撑着政务大数据的核心价值实现(服务于公民、企业、外国人和其他社会组织)。依据《政务信息资源目录体系 第3部分:核心元数据》标准,核心元数据内容有20项(其中,必选项有6项)。如下图所示(加*的为必选项):

以政务的核心技术元数据为例,“政务部门”的属性数据应该有“标识ID、名称、描述”以及联系方式等信息;“部门服务”的属性数据应该有“服务ID、名称、描述、语言、访问地址、绑定结构”以及约束限制等信息;“服务模型”的属性数据应该有“标识、名称、描述、描述语言、描述文档”等信息。依据《政务信息资源共享管理暂行办法》(国发〔2016〕51号),政务信息资源目录分为基础信息资源、主题信息资源和部门信息资源三大类,其主要内容就是政务大数据的元数据。

政务大数据的主数据是服务于政务信息集成与共享的全局性政务信息资源数据,其核心价值在于在全局范围内具有较高的可共享性。元数据强调的是规则、规范和标准,说明数据的组成结构;主数据是被实例化的,是被反复引用的关键业务数据,强调的是政务数据集成共享后的核心业务价值。同时,主数据是基于元数据而有效发挥作用的,是基于政务资源目录的政务信息共享交换平台所共享交换的主要内容。如政府权责清单(权力清单、责任清单)、行政许可事项,以及政务信息资源目录所具体指向的、服务于信息集成和共享的相应信息资源就是典型的政务大数据主数据。

政务大数据的主题数据是对政务信息资源进行战略规划后的产出物,体现的是数据视角下的政务业务融合。主题数据和主数据的联系非常紧密,在部分场景(如面向信息共享服务)下是有交叉的。两者的主要区别在于主数据是应用集成在数据层面的体现,主题数据是信息集成在数据层面的体现。因此,主题数据更加强调全局战略规划。做好主题数据的规划,将对主数据的建立和治理提供重要参照。政务大数据的主题数据是围绕政府职能的变革而变革、发展而发展的。政务大数据的主题数据库,将是其提供数据价值服务的重要载体和资源。如公安大数据、农业大数据、工业大数据等都可以视为典型的政务大数据的行业主题数据库。当然,这种行业主题的范围过于宽泛,需要逐级细化到第三层才能更好地形成政务大数据的元服务。以公安大数据为例,其第二层假设为治安管理主题,其第三层继续分解出“社区网格化联动”,就可以对接具体的政务数据服务了。

除了元数据、主数据和主题数据,政务大数据的数据元(基本数据单元)的规划、治理对提高电子政务系统之间的互操作性、协同性也非常重要。在《GBT 19488.2-2008 电子政务数据元 第2部分:公共数据元目录》中,对电子政务的公共数据元进行了标准化。政务大数据的数据元是政务大数据主题数据库的重要逻辑构件。多个数据元可以组合在一起形成复合的政务数据元,从而提供更综合的政务数据服务。

在探讨完毕政务大数据的三个核心部件(元数据、主数据、主题数据)之后,我们来看其数据存储、计算和服务三个重要层面,以及采集、运营和管理三个基础体系。政务大数据的主题数据为其元服务建立了重要基础,在物理上需要构建其存储、计算和服务三层模式。政务大数据的元数据规划、治理好了,其存储模式也就建立了;计算层的计算能力有赖于主数据的规划、治理;服务层的服务能力依托于主题数据的规划、治理。鉴于“漫谈政务大数据”系列文章计划专门有一篇关于政务大数据物理模型的,因此本文不对其数据存储、计算和服务三层模式做具体展开。在政务大数据的逻辑模型中,还有数据采集、运营和管理这三个基础体系。简言之,基于元数据进行数据采集,基于主数据进行数据治理,基于主题数据提供数据服务,政务大数据的运营和管理就是进行数据治理和提供数据服务的过程。这三个基础体系将在《政务大数据的价值链》、《政务大数据的运营》等后续文章中继续讨论。

综上,政务大数据的核心部件是其元数据、主数据和主题数据,在物理上分为数据存储、计算和服务,在体系上又涵盖数据采集、运营和管理。

原文发布于微信公众号 - 大数据和云计算技术(jiezhu2007)

原文发表时间:2018-02-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏SDNLAB

POF:更理想的SDN?

OpenFlow协议实现的SDN目前已经得到了应用和推广,但OpenFlow并不完美,OpeFlow交换机还不能提供更好的可编程能力。POF作为一种新的南向协议...

3835
来自专栏CSDN技术头条

专访Databricks辛湜,谈Spark排序比赛摘冠及生态圈热点

据Sort Benchmark最新消息,Databricks的Spark与加州大学圣地亚哥分校的TritonSort两个系统在2014 Daytona Gray...

17810
来自专栏CSDN技术头条

微服务与单一整体式架构的优劣浅析

责编/钱曙光,关注架构和算法领域 开发者要么出于本能,要么很快就能在痛苦中发觉:即便一个很小的变化也能改变一切。就像攀岩那样,每次挪移都会影响到未来的抉择,因此...

1897
来自专栏IT派

2018 年 4 月全球数据库排名:PostgreSQL 略有下降

DB-Engines 发布了 2018 年 4 月份的数据库排名,排名前三的依然是 Oracle、MySQL 和 Microsoft SQL Server 。

840
来自专栏风火数据

大数据 Hadoop:一把杀鸡用的宰牛刀

Hadoop是个庞大的重型解决方案,它的设计目标本来就是大规模甚至超大规模的集群,面对的是上百甚至上千个节点,这样就会带来两个问题:

932
来自专栏PPV课数据科学社区

【技术】Hadoop选择:可供参考的几大因素

Apache Hadoop的发展已经经历了很长一段时间,也经历也一段从初生到成熟之旅,在Apache Hadoop的起步阶段,主要支持类似搜索引擎的...

2444
来自专栏CDA数据分析师

译文|Airbnb助力Hadoop SQL查询引擎!

Airbnb是Hadoop在国内的一个公开资源数据开发和SQL查询工具。它的出现,能给Facebook Presto云技术的发展注入一剂强心剂吗? 7个你不知...

1829
来自专栏Cloud Native - 产品级敏捷

微服务架构设计 第四步: 分析微服务架构依赖与风险; 开发微服务最关键的一步

2016.9.11, 深圳, Ken Fang 当特性负责人与架构师, 开发骨干人员, 测试经理, 资深测试人员协作, 而可针对特性下的所有微服务 (funct...

1949
来自专栏Forrest随想录

从技术角度谈谈鹿晗这个事儿

关于鹿晗事件拖垮微博这件事,分享下我的理解。只做客观分析,不吹,不喷,不黑,因为这个事情绝对不是像网上传的,什么微博架构烂、技术不行、可扩展性差、控制预算成本所...

732
来自专栏数据和云

追寻完美:数据库SQL优化极致 之 关心隐藏的部分

张中靖 云和恩墨技术专家,软件研发总监 我们先来听一个【老木匠和小木匠的故事】 同样做柜子,老木匠做的是两面光,柜子内外摸起来一样光滑、不扎手;而小木匠做的,大...

2705

扫描关注云+社区