政务大数据的逻辑模型

政务是个大市场,阿里、腾讯、电信、华为都在赔本赚吆喝。本文作者宇同学是资深从业人士,研发总监,他会写一系列文章来阐述政务云全景。

前面三篇分别深入阐述:

  1. 政务大数据点本质:《 浅谈政务大数据的本质
  2. 政务大数据的全景图:《政务大数据的全景图
  3. 政务大数据的上下文范围:《政务大数据的上下文范围
  4. 政务大数据的概念模型:《政务大数据的概念模型

反响非常好,本篇接上一篇讲讲政务大数据的逻辑模型。希望大家会喜欢!

后续还有一系列文章;敬请期待。

在《政务大数据的概念模型》一文中,重点讨论了政务大数据的业务实体关系,即其外模式(用户视图)。政务大数据的逻辑模型(模式)是基于其概念模型,对其逻辑结构进行数据建模,它重在说明数据之间的逻辑关系。自底向上而言,政务大数据的逻辑模型包括:元数据、主数据和主题数据三个核心部件,数据存储、数据计算和数据服务三个重要层面,数据采集、数据运营和数据管理三个基础体系。

先看政务大数据的三个核心部件。

作为“数据的数据”(data about data),政务元数据服务于政务大数据的采集、标准化、规范化和数据交换。提到元数据,不得不提OMG(Object Management Group)的 CWM(Common Warehouse Metamodel ),即通用数据仓库元模型。CWM定义了元数据的规范、标准,覆盖了关系型、非关系型和多维数据,以及在数据仓库环境之下的其他数据对象。作为基于传统数据仓库理论的元数据定义,在大数据的应用情景下依然适用。在大数据的应用场景下,元数据也依然是重要的标准化组成部件。按照元数据的用途,可分为技术元数据(用于开发和日常管理如控制)和业务元数据(关键业务价值、业务上下文)。前者是运作保障,后者是实质内容。元数据尤其是技术元数据的标准化、规范化程度(数据标准、映射关系和规则)决定了数据的质量,元数据尤其是业务元数据的规划设计水平决定了数据的价值。就政务大数据而言,其技术元数据支撑着政务应用体系的开发规范和控制模型,业务元数据支撑着政务大数据的核心价值实现(服务于公民、企业、外国人和其他社会组织)。依据《政务信息资源目录体系 第3部分:核心元数据》标准,核心元数据内容有20项(其中,必选项有6项)。如下图所示(加*的为必选项):

以政务的核心技术元数据为例,“政务部门”的属性数据应该有“标识ID、名称、描述”以及联系方式等信息;“部门服务”的属性数据应该有“服务ID、名称、描述、语言、访问地址、绑定结构”以及约束限制等信息;“服务模型”的属性数据应该有“标识、名称、描述、描述语言、描述文档”等信息。依据《政务信息资源共享管理暂行办法》(国发〔2016〕51号),政务信息资源目录分为基础信息资源、主题信息资源和部门信息资源三大类,其主要内容就是政务大数据的元数据。

政务大数据的主数据是服务于政务信息集成与共享的全局性政务信息资源数据,其核心价值在于在全局范围内具有较高的可共享性。元数据强调的是规则、规范和标准,说明数据的组成结构;主数据是被实例化的,是被反复引用的关键业务数据,强调的是政务数据集成共享后的核心业务价值。同时,主数据是基于元数据而有效发挥作用的,是基于政务资源目录的政务信息共享交换平台所共享交换的主要内容。如政府权责清单(权力清单、责任清单)、行政许可事项,以及政务信息资源目录所具体指向的、服务于信息集成和共享的相应信息资源就是典型的政务大数据主数据。

政务大数据的主题数据是对政务信息资源进行战略规划后的产出物,体现的是数据视角下的政务业务融合。主题数据和主数据的联系非常紧密,在部分场景(如面向信息共享服务)下是有交叉的。两者的主要区别在于主数据是应用集成在数据层面的体现,主题数据是信息集成在数据层面的体现。因此,主题数据更加强调全局战略规划。做好主题数据的规划,将对主数据的建立和治理提供重要参照。政务大数据的主题数据是围绕政府职能的变革而变革、发展而发展的。政务大数据的主题数据库,将是其提供数据价值服务的重要载体和资源。如公安大数据、农业大数据、工业大数据等都可以视为典型的政务大数据的行业主题数据库。当然,这种行业主题的范围过于宽泛,需要逐级细化到第三层才能更好地形成政务大数据的元服务。以公安大数据为例,其第二层假设为治安管理主题,其第三层继续分解出“社区网格化联动”,就可以对接具体的政务数据服务了。

除了元数据、主数据和主题数据,政务大数据的数据元(基本数据单元)的规划、治理对提高电子政务系统之间的互操作性、协同性也非常重要。在《GBT 19488.2-2008 电子政务数据元 第2部分:公共数据元目录》中,对电子政务的公共数据元进行了标准化。政务大数据的数据元是政务大数据主题数据库的重要逻辑构件。多个数据元可以组合在一起形成复合的政务数据元,从而提供更综合的政务数据服务。

在探讨完毕政务大数据的三个核心部件(元数据、主数据、主题数据)之后,我们来看其数据存储、计算和服务三个重要层面,以及采集、运营和管理三个基础体系。政务大数据的主题数据为其元服务建立了重要基础,在物理上需要构建其存储、计算和服务三层模式。政务大数据的元数据规划、治理好了,其存储模式也就建立了;计算层的计算能力有赖于主数据的规划、治理;服务层的服务能力依托于主题数据的规划、治理。鉴于“漫谈政务大数据”系列文章计划专门有一篇关于政务大数据物理模型的,因此本文不对其数据存储、计算和服务三层模式做具体展开。在政务大数据的逻辑模型中,还有数据采集、运营和管理这三个基础体系。简言之,基于元数据进行数据采集,基于主数据进行数据治理,基于主题数据提供数据服务,政务大数据的运营和管理就是进行数据治理和提供数据服务的过程。这三个基础体系将在《政务大数据的价值链》、《政务大数据的运营》等后续文章中继续讨论。

综上,政务大数据的核心部件是其元数据、主数据和主题数据,在物理上分为数据存储、计算和服务,在体系上又涵盖数据采集、运营和管理。

原文发布于微信公众号 - 大数据和云计算技术(jiezhu2007)

原文发表时间:2018-02-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据的力量

一流公司员工必须熟练掌握职场的七种工具,收集齐全了!!

意义:帮您清晰地把握全局,分析自己在资源方面的优势与劣势,把握环境提供的机会,防范可能存在的风险与威胁,对我们的成功有非常重要的意义。

641
来自专栏PPV课数据科学社区

【必看】最完善的公司数据分析评估指标体系

俗话说,无规矩不成方圆。”你不去度量的东西,就很难管理好。” 也许还有人对这句话的真实性不以为然。然而,如果没有适当的方法了解你以前...

3104
来自专栏竹清助手

每一个程序员都是自学成才

为什么CS学位并非是成为开发人员的唯一路径,因为每个开发人员在工作于他们的项目时学到了很多很多。

802
来自专栏架构师小秘圈

一名曾在BAT待过十年的资深Java架构师的经验之谈

所谓架构师,思考的是全局的东西,是如何组织你的系统,以达到业务要求,性能要求,具备可扩展性(scalability),可拓展性(extendability),前...

3354
来自专栏程序员的知识天地

Redis的之父九条忠告,如何成为“一打十”的程序员

据维基百科记载:“Redis是一个使用ANSI C编写的开源,支持网络,基于内存,可选持久性的键值对存储数据库。根据月度排行网站DB-Engines.com的数...

1081
来自专栏VRPinea

迪士尼申请AR投影专利,致力打造全新主题乐园体验

3768
来自专栏互联网杂技

2017年热门编程语言排行榜,Javascript表现如何呢?

想知道全球最受欢迎的编程语言是什么吗?它们的判断标准又是怎样的呢? ? 我们都知道,C++,MATLAB,Java 一直都受到技术学院的青睐,大多数毕业生都热衷...

3296
来自专栏about云

一个架构师谈什么是架构以及怎么成为一个架构师

问题导读: 1.架构的定义是什么? 2.什么是架构之美? 3.架构师都要会做什么? 新年新事,来点轻松的话题。我们调剂一下后再继续讲CAS SSO...

3505
来自专栏华章科技

7个实战案例、24个学习视频、12G干货资料...今天带你免费入门Python数据分析!

你花了大半天整合了一张数据表,却因为其他部门的错误,导致表格结构全错了!于是你又要吭哧吭哧重新来过……

833
来自专栏程序员的知识天地

前端菜鸟是这样入门学习的,点进来!

现在从事IT方向的人有很多。由于Web前端薪资水平高,职业前景广阔,岗位缺口大,就业口径宽,想通过学习Web前端开发从而进入到该行业工作的人越来越多。当然也有很...

1771

扫码关注云+社区