政务大数据的逻辑模型

政务是个大市场,阿里、腾讯、电信、华为都在赔本赚吆喝。本文作者宇同学是资深从业人士,研发总监,他会写一系列文章来阐述政务云全景。

前面三篇分别深入阐述:

  1. 政务大数据点本质:《 浅谈政务大数据的本质
  2. 政务大数据的全景图:《政务大数据的全景图
  3. 政务大数据的上下文范围:《政务大数据的上下文范围
  4. 政务大数据的概念模型:《政务大数据的概念模型

反响非常好,本篇接上一篇讲讲政务大数据的逻辑模型。希望大家会喜欢!

后续还有一系列文章;敬请期待。

在《政务大数据的概念模型》一文中,重点讨论了政务大数据的业务实体关系,即其外模式(用户视图)。政务大数据的逻辑模型(模式)是基于其概念模型,对其逻辑结构进行数据建模,它重在说明数据之间的逻辑关系。自底向上而言,政务大数据的逻辑模型包括:元数据、主数据和主题数据三个核心部件,数据存储、数据计算和数据服务三个重要层面,数据采集、数据运营和数据管理三个基础体系。

先看政务大数据的三个核心部件。

作为“数据的数据”(data about data),政务元数据服务于政务大数据的采集、标准化、规范化和数据交换。提到元数据,不得不提OMG(Object Management Group)的 CWM(Common Warehouse Metamodel ),即通用数据仓库元模型。CWM定义了元数据的规范、标准,覆盖了关系型、非关系型和多维数据,以及在数据仓库环境之下的其他数据对象。作为基于传统数据仓库理论的元数据定义,在大数据的应用情景下依然适用。在大数据的应用场景下,元数据也依然是重要的标准化组成部件。按照元数据的用途,可分为技术元数据(用于开发和日常管理如控制)和业务元数据(关键业务价值、业务上下文)。前者是运作保障,后者是实质内容。元数据尤其是技术元数据的标准化、规范化程度(数据标准、映射关系和规则)决定了数据的质量,元数据尤其是业务元数据的规划设计水平决定了数据的价值。就政务大数据而言,其技术元数据支撑着政务应用体系的开发规范和控制模型,业务元数据支撑着政务大数据的核心价值实现(服务于公民、企业、外国人和其他社会组织)。依据《政务信息资源目录体系 第3部分:核心元数据》标准,核心元数据内容有20项(其中,必选项有6项)。如下图所示(加*的为必选项):

以政务的核心技术元数据为例,“政务部门”的属性数据应该有“标识ID、名称、描述”以及联系方式等信息;“部门服务”的属性数据应该有“服务ID、名称、描述、语言、访问地址、绑定结构”以及约束限制等信息;“服务模型”的属性数据应该有“标识、名称、描述、描述语言、描述文档”等信息。依据《政务信息资源共享管理暂行办法》(国发〔2016〕51号),政务信息资源目录分为基础信息资源、主题信息资源和部门信息资源三大类,其主要内容就是政务大数据的元数据。

政务大数据的主数据是服务于政务信息集成与共享的全局性政务信息资源数据,其核心价值在于在全局范围内具有较高的可共享性。元数据强调的是规则、规范和标准,说明数据的组成结构;主数据是被实例化的,是被反复引用的关键业务数据,强调的是政务数据集成共享后的核心业务价值。同时,主数据是基于元数据而有效发挥作用的,是基于政务资源目录的政务信息共享交换平台所共享交换的主要内容。如政府权责清单(权力清单、责任清单)、行政许可事项,以及政务信息资源目录所具体指向的、服务于信息集成和共享的相应信息资源就是典型的政务大数据主数据。

政务大数据的主题数据是对政务信息资源进行战略规划后的产出物,体现的是数据视角下的政务业务融合。主题数据和主数据的联系非常紧密,在部分场景(如面向信息共享服务)下是有交叉的。两者的主要区别在于主数据是应用集成在数据层面的体现,主题数据是信息集成在数据层面的体现。因此,主题数据更加强调全局战略规划。做好主题数据的规划,将对主数据的建立和治理提供重要参照。政务大数据的主题数据是围绕政府职能的变革而变革、发展而发展的。政务大数据的主题数据库,将是其提供数据价值服务的重要载体和资源。如公安大数据、农业大数据、工业大数据等都可以视为典型的政务大数据的行业主题数据库。当然,这种行业主题的范围过于宽泛,需要逐级细化到第三层才能更好地形成政务大数据的元服务。以公安大数据为例,其第二层假设为治安管理主题,其第三层继续分解出“社区网格化联动”,就可以对接具体的政务数据服务了。

除了元数据、主数据和主题数据,政务大数据的数据元(基本数据单元)的规划、治理对提高电子政务系统之间的互操作性、协同性也非常重要。在《GBT 19488.2-2008 电子政务数据元 第2部分:公共数据元目录》中,对电子政务的公共数据元进行了标准化。政务大数据的数据元是政务大数据主题数据库的重要逻辑构件。多个数据元可以组合在一起形成复合的政务数据元,从而提供更综合的政务数据服务。

在探讨完毕政务大数据的三个核心部件(元数据、主数据、主题数据)之后,我们来看其数据存储、计算和服务三个重要层面,以及采集、运营和管理三个基础体系。政务大数据的主题数据为其元服务建立了重要基础,在物理上需要构建其存储、计算和服务三层模式。政务大数据的元数据规划、治理好了,其存储模式也就建立了;计算层的计算能力有赖于主数据的规划、治理;服务层的服务能力依托于主题数据的规划、治理。鉴于“漫谈政务大数据”系列文章计划专门有一篇关于政务大数据物理模型的,因此本文不对其数据存储、计算和服务三层模式做具体展开。在政务大数据的逻辑模型中,还有数据采集、运营和管理这三个基础体系。简言之,基于元数据进行数据采集,基于主数据进行数据治理,基于主题数据提供数据服务,政务大数据的运营和管理就是进行数据治理和提供数据服务的过程。这三个基础体系将在《政务大数据的价值链》、《政务大数据的运营》等后续文章中继续讨论。

综上,政务大数据的核心部件是其元数据、主数据和主题数据,在物理上分为数据存储、计算和服务,在体系上又涵盖数据采集、运营和管理。

原文发布于微信公众号 - 大数据和云计算技术(jiezhu2007)

原文发表时间:2018-02-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

大数据可视化、实时性分析的工具——Datawatch

编者注:互联网后时代,我们谈的最多的不是电脑,而是基于互联网产生的伟大的互联网公司,比如谷歌、微软、百度、阿里巴巴等;移动互联网后时代,我们谈的更多的不是手机,...

37110
来自专栏IT技术精选文摘

揭秘微信朋友圈广告背后的技术

1.起源 朋友圈广告项目于2015年1月对外发布,我们第一个非商业广告是龙哥想出来的创意,大家应该都有印象,为我们的“与众不同”奠定了基调,也为后面的商业广告预...

1828
来自专栏陈功的专栏

独家揭秘微信朋友圈广告背后的技术

本文从朋友圈广告项目起源出发进而介绍朋友圈广告系统与社交计算,在了解了基本机制之后进行广告质量预估,在进行速度和人群控制之后,获取后台架构及客户端支持完成整个项...

1.4K1
来自专栏云计算D1net

揭开DevOps的黑暗面!

DevOps理念广受青睐。在现实中,DevOps同样遭受地盘之争,而传统IT也没有适合的工具提供支持。它同样给IT带来不少新挑战,包括来自同行的孤立与非结构化的...

2996
来自专栏挖掘大数据

推荐系列01:人工智能与推荐系统

前段时间给朋友整理一个关于推荐系统相关的知识教学体系,刚好自身业务中,预计明年初随着业务规模增长,估摸着又要启动推荐相关的项目了,所以也是趁机把相关的知识结构梳...

7410
来自专栏腾讯云技术沙龙

董燚:小程序音视频典型应用场景剖析

我叫董燚,是腾讯云视频的产品经理。先后就职于乐视云、腾讯云。进入乐视之后,我发现乐视是一家PPP公司,两年的时间,一年开100多场发布会。我的老板不太热衷于做...

1.3K14
来自专栏Forrest随想录

从技术角度谈谈鹿晗这个事儿

关于鹿晗事件拖垮微博这件事,分享下我的理解。只做客观分析,不吹,不喷,不黑,因为这个事情绝对不是像网上传的,什么微博架构烂、技术不行、可扩展性差、控制预算成本所...

792
来自专栏智能计算时代

网站可靠性工程:DevOps 2.0

在DevOps中有没有更好的时间?电视节目如“兴趣人物”和“先生机器人“正在越来越好地显示开发人员的实际工作,使用大量的工作代码。像迈克尔·曼(Michael ...

3617
来自专栏圆方圆学院精选

【董天一】IPFS如何挖矿<Filecoin系统>?(一)

本来这篇文章应该晚一点写, 但是这几天一直有朋友在公众号留言, 迫切的想知道IPFS到底如何挖矿, 所以就提前写一篇关于IPFS挖矿的文章. 本文暂不涉及具体的...

1171
来自专栏BestSDK

Mapbox更新Maps SDK ,可让游戏快速实现AR化

Mapbox是基于移动和Web应用程序的位置数据平台,可构建基块,将地图、搜索和导航等位置功能添加到用户创建的任何体验中。

681

扫码关注云+社区