元数据的作用

刘耀铭同学元数据系列作品的第二篇,大家支持!

其他相关文章:

元数据概念

基于元数据驱动的ETL

Hive 元数据表结构详解

上一遍我们了解了什么是元数据,即元数据的定义,我们知道了元数据是对数据的描述以及解释,它用来说明数据内容质量状况和其他特征的背景信息。那么元数据具体有什么作用呢?

1、元数据是进行数据集成所必须的。

怎么理解?我们知道一个数据仓库是由外部数据、业务数据以及文档资料通过某些抽取工具而得到的,数据集市就是数据仓库经过元数据的定义,约定它的结构等信息所产生。元数据做到了对数据仓库有效的数据存储与管理;

2、元数据可以帮助用户理解数据仓库的数据

元数据为运行时的系统提供了统一的可读的系统模型,系统运行时可以使得实体对象通过运行时的元数据模型来得知自身的结构、自身的特征。

3、元数据是保证数据质量的关键

元数据做到了对数据仓库结构的描述,仓库模式试图,维,度量,层次结构,到处数据库的定义,以及数据集市的位置和内容。

4、元数据可以支持需求变化

元数据独立于平台,无论使用什么技术平台,元数据本身不受影响。所以元数据可以支持需求的变化。

5、元数据是独立性强,是与平台无关的,无论使用什么技术平台,元数据自身不收到任何影响,这就保证了元数据的通用性和移植性,能使它发挥最大的效用。

6、元数据是生成其他数据模型的基础,有了元数据,就可以借用相应的代码生成器或者相应的工具生成可直接使用的其他数据模型和代码信息。

7、元数据可以为运行中的系统提供统一的可读的系统模型,使系统在运行时可以使那些实体对象通过元数据来了解其本身的特征、结构、地位以及其他对象之间的关系等。这样可以从一个新的角度来理解、设计和开发系统。

元数据在网络信息资源组织方面的作用可以概括在以后六个方面:描述、检索、选择、定位、管理和评估。

资源描述:元数据的最基本的功能就是对信息资源对象进行描述,这也就是对数据的解释和说明,这里可以描述信息资源的主题、内容、属性、特点等。

资源检索:可以利用元数据更方便快捷地组织信息资源,并建立各资源对象之间的联系。为用户提供更多途径、多层次的检索方式,从而有利于用户更加方便快速地防线自己所真正需要的资源和信息。

资源选择:元数据可以帮助用户更快的进行信息的取舍。在元数据的支持下,用户可以不必浏览信息本身对象,就可以对信息进行基本的了解和认识,并且挑选自己需要的信息,加快了选择信息资源的速度,提高了方便程度。

资源定位:元数据可以为用户提供信息资源本身的位置方面的信息,方便准备地获取信息资源所在的位置,方便信息资源管理。

资源管理:元数据可以用于信息资源的保存和管理,包括资源的加工存储结构、使用管理等方面的信息,也包括使用权、版权所有权、防伪方式、电子签名、电子水印等信息。是信息资源的管理更加正规。权限更加明确。

资源评估:主要是保存信息西苑的使用情况之类的信息,还有被评价的相关信息。研究和管理者就可以利用这些信息对资源进行统计分析,并反馈给资源建立和管理者,使其更好的组织资源,更好的为用户服务。

原文发布于微信公众号 - 大数据和云计算技术(jiezhu2007)

原文发表时间:2016-11-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Java Edge

RabbitMQ 实践之路(一)-概述1 将 GET 到的技能2 低门槛,入门核心概念3 渐进式,逐步深入高级特性4 与 Spring 家族整合5 高可用,构建集群架构6 领略 SET 架构演化与设计

692
来自专栏加米谷大数据

什么是 Apache Spark?大数据分析平台详解

自从 Apache Spark 2009 年在 U.C. Berkeley 的 AMPLab 默默诞生以来,它已经成为这个世界上最重要的分布式大数据框架之一。S...

1083
来自专栏java思维导图

快速回顾,浅谈mvc思想

1 百科 全名是Model View Controller,模型(model)-视图(view)-控制器(controller)的缩写,一种设计模式(Desig...

2424
来自专栏IT大咖说

大数据平台架构技术选型与场景运用

摘要 本次分享将结合多个大数据项目与产品研发的经验,探讨如何基于不同的需求场景搭建通用的大数据平台。内容涵盖数据采集、存储与分析处理等多方面的主流技术、架构决策...

4215
来自专栏SDNLAB

P4:开创数据平面可编程时代

现有的SDN解决方案将控制平面与转发平面分离,并为我们提供了控制平面的可编程能力。而事实上,目前通过软件编程实现的控制平面的功能,在传统的高级交换机和路由器上也...

3497
来自专栏一个会写诗的程序员的博客

测试思考拾叶集测试万能公式自动化测试自动化测试分层自动化测试框架工具平台数据准备服务Bug

须理清“SUT的功能”,“SUT的所有输入”,“每一个输入的取值范围”,“SUT的所有输出”,“根据功能推出每一个输出的预期值”。

704
来自专栏程序你好

在代码中封装变化

软件开发是一种独特的人类活动,但与其他活动,如:数学、写作和工程等相似。我认为编写软件是一个建模过程,但是,与在空间中建模物理事物不同,我们建模的是在时间中发生...

531
来自专栏挖掘大数据

大数据分析平台 Apache Spark详解

Apache Spark是一款快速、灵活且对开发者友好的工具,也是大型SQL、批处理、流处理和机器学习的领先平台。自从 Apache Spark 2009 年在...

3130
来自专栏阿杜的世界

Netty学习

633
来自专栏SDNLAB

SD-WAN解决方案如何提高网络性能?

在2016年国家广域网报告调查中,有要求受访者表明对其WAN影响最大的因素。考虑到与局域网不同,广域网有一些性能限制特征,如包丢失和延迟程度高,因此受访者表示的...

451

扫描关注云+社区