都柏林核心(Dublin Core)

在上一篇日志中,我介绍了元数据(MetaData),并且说只要有一个集合,就可以定义一套元数据。

这样一来,很自然的,我们就会想到一个问题:有没有可能定义一套通用的元数据,即所有的信息都可以用一套元数据来描述?

1995 年3 月,国际图书馆电脑中心(Online Computer Library Center,简称OCLC)在美国俄亥俄州小城都柏林,提出一套元数据的元素集(metadata element set),用来描述网上的信息,实际上这等于可以描述一切信息。这套元数据被称为"都柏林核心"(Dublin Core)。经过10年的发展,已经在全世界得到了广泛采用。

在"都柏林核心"的简化形式(Simple Dublin Core)中,共包含15个元素,它们是:

元素名称:题名(Title) 定义:赋予资源的名称 。 注释:资源名一般指资源对象正式公开的名称。

元素名称: 创建者(Creator) 定义:创建资源内容的主要责任者。 注释:创建者的实例包括个人,组织或某项服务。一般而言,用创建者的名称来标识这一条目。

元素名称: 主题(Subject) 定义:资源内容的主题描述。 注释:如果要描述特定资源的某一主题,一般采用关键词、关键字短语或分类号,最好主题和关键词从受控词表或规范的分类体系中取值。

元素名称: 描述(Description) 定义:资源内容的说明。 注释:描述可以包括但不限于以下内容:文摘、目录、对以图形来揭示内容的资源而言的文字说明、或者一个有关资源内容的自由文本描述。

元素名称: 出版者(Publisher) 定义:使资源成为可以获得并可用的责任者。 注释:出版者的实例包括个体,组织,或服务。一般而言,应该用出版者的名称来标识这一条目。

元素名称: 其他责任者(Contributor) 定义:对资源的内容作出贡献的其他实体。 注释:其他责任者的实例可包括个人、组织或某项服务。一般而言,用其他责任者的名字来标识这一条目。

元素名称: 日期(Date) 定义:与资源生命周期中的一个事件相关的时间。 注释:一般而言,日期应与资源的创建或出版日期相关。建议采用的日期格式应符合ISO 8601 [W3CDTF]规范,并使用YYYY-MM-DD的格式。

元素名称: 类型(Type) 定义:资源内容的特征或类型。 注释:资源类型包括描述资源内容的一般范畴,功能,种属,或聚类层次的术语。建议采用来自于受控词表中的值(例如DCMI类型词汇表[DCMITYPE])。要描述资源的物理或数字化表现形式,请使用"格式(FORMAT)"元素 。

元素名称: 格式(Format) 定义:资源的物理或数字表现形式。 注释:一般而言,格式可能包括资源的媒体类型或资源的大小,格式元素可以用来决定展示或操作资源所需的软硬件或其他相应设备,例如大小包括资源所占的存储空间及持续时间。建议采用来自于受控词表中的值(例如用"Internet媒体类型[MIME]"列表中的词定义计算机媒体格式)。

元素名称: 标识符(Identifier) 定义:在特定的范围内给予资源的一个明确的标识。 注释:建议对资源的标识采用符合某一正式标识体系的字符串及数字组合。例如正式的标识体系包括统一资源标识符(URI) (包含统一资源定位符URL)、数字对象标识符 (DOI)和国际标准书号 (ISBN)。

元素名称: 来源(Source) 定义:对当前资源来源的参照。 注释:当前资源可能部分或全部源自该元素所标识的资源,建议对这一资源的标识采用一个符合正式标识系统的字串及数字组合 。

元素名称: 语种(Language) 定义:描述资源知识内容的语种。 注释:建议本元素的值采用RFC 3066[RFC3066],该标准与ISO 639 [ISO639]一起定义了由两个或三个英文字母组成的主标签和可选的子标签来标识语种。例如用"en"或"eng"来表示English, "akk" 来表示Akkadian, "en-GB"表示英国英语。

元素名称: 关联(Relation) 定义:对相关资源的参照。 注释:建议最好使用符合规范标识体系的字符串或数字来标识所要参照的资源。

元素名称: 覆盖范围(Coverage) 定义:资源内容所涉及的外延与覆盖范围。 注释:覆盖范围一般包括空间位置(一个地名或地理坐标)、时间区间(一个时间标签,日期或一个日期范围)或者行政辖区的范围(比如指定的一个行政实体)。推荐覆盖范围最好是取自于一个受控词表(例如地理名称叙词表[TGN]),并应尽可能地使用由数字表示的坐标或日期区间来描述地名与时间段 。

元素名称: 权限(Rights) 定义:有关资源本身所有的或被赋予的权限信息。 注释:一般而言,权限元素应包括一个对资源的权限声明,或者是对提供这一信息的服务的参照。权限一般包括知识产权(IPR),版权或其他各种各样的产权 。如果没有权限元素的标注,不可以对与资源相关的上述或其他权利的情况作出任何假定。

现在,大中型图书馆几乎全部采用"都柏林核心"记录书籍信息,因此很容易在图书馆的数据库中找到实例。

[参考链接]

* 都柏林核心官方网站(英文) * 2004年都柏林核心年会,上海 (中文)

(完)

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏cnblogs

webpack + vue 在dev和production模式下的小小区别

18820
来自专栏CSDN技术头条

Go语言实践:从新手入门到上线真实的小型服务所遇到的那些坑

Teamwork团队在去年写了近20万行Go代码,建造了一堆速度奇快的小型HTTP服务,本文列出了他们总结的9条经验教训。 为什么选择Go语言?Go语言,又称G...

23370
来自专栏Golang语言社区

Go语言实践:从新手入门到上线真实的小型服务所遇到的那些坑

摘要: Teamwork团队在去年写了近20万行Go代码,建造了一堆速度奇快的小型HTTP服务,本文列出了他们总结的9条经验教训。 为什么选择Go语言?Go...

38560
来自专栏Java帮帮-微信公众号-技术文章全总结

从零开始学Java-SpringMVC统一异常处理

看到 Exception 这个单词都心慌 如果有一天你发现好久没有看到Exception这个单词了,那你会不会想念她?我是不会的。她如女孩一样的令人心动又心慌...

35040
来自专栏青玉伏案

设计模式(八): 从“小弟”中来类比"外观模式"(Facade Pattern)

在此先容我拿“小弟”这个词来扯一下淡。什么是小弟呢,所谓小弟就是可以帮你做一些琐碎的事情,在此我们就拿“小弟”来类比“外观模式”。在上面一篇博文我们完整的介绍了...

239100
来自专栏牛客网

2018秋招面经-后端开发

博主渣渣本科,挣扎到十一月秋招终于结束了。面过百度/腾讯/小米/网易/搜狗/知乎/京东/360/瓜子。期间总结了一些面试题目,现在放上来。由于是博主自己的面经记...

43590
来自专栏Golang语言社区

Go语言实践:从新手入门到上线真实的小型服务所遇到的那些坑

摘要: Teamwork团队在去年写了近20万行Go代码,建造了一堆速度奇快的小型HTTP服务,本文列出了他们总结的9条经验教训。 为什么选择Go语言?Go...

35880
来自专栏AI科技评论

开发 | Python高级技巧:用一行代码减少一半内存占用

我想与大家分享一些我和我的团队在一个项目中经历的一些问题。在这个项目中,我们必须要存储和处理一个相当大的动态列表。测试人员在测试过程中,抱怨内存不足。下面介绍一...

12740
来自专栏Python

MongoDB

一 简介 MongoDB是一款强大、灵活、且易于扩展的通用型数据库 1、易用性 MongoDB是一个面向文档(document-oriented)的数据库,而不...

34860
来自专栏腾讯大讲堂的专栏

设计模式笔记

| 导语 “计算机科学领域的任何问题都可以通过增加一个间接的中间层来解决” “Any problem in computer science can be so...

51380

扫码关注云+社区

领取腾讯云代金券