PIDapalooza 2018 见闻

PIDapalooza 2018见闻

郭晓峰 万方数据DOI中心

2018年1月23~24日,第二届PIDapalooza在西班牙巴塞罗那附近的赫罗拉成功举办,笔者有幸参加并目睹盛会。PIDapalooza是个什么样的活动?要回答这个问题,首先要说明白PID是什么。PID (Persistent Identifier)意为“持久标识符”,并不限于某一种标识符,而是一种概念,涵盖了诸如DOI、ORCID等我们熟知的标识符,以及更多的、并不为人所熟知的标识符。2016年11月,为了推动PID在学术界的发展与应用,Crossref、DataCite和ORCID三家“PID”组织以及加州数字图书馆(California Digital Library)联合举办了第一届PIDapalooza,即PID开放节日。由于受到了广泛的欢迎,这四家机构于2018年1月继续举办了第二届PIDapalooza,并得到了巴塞罗那大学的支持。有约200名世界各地的与会者共聚一堂,他们主要来自PID组织、出版商、数据中心、研究者、学术相关服务提供商及应用研发者等。近60余名演讲者主持分享了50余场研讨活动,涵盖PID演示、研讨、头脑风暴以及PID的最新发展资讯等多种形式。

图1:开幕式上主办方共同点燃PID火炬

两天的会议在三个分会场同时举办,主会场还举办了开幕式、每天的开场和闭场评述等活动,每场活动的时间均在半小时左右。2018年会议的主题涉及如何实现持久性以及PID在促进学术内容持久利用方面的最新进展、PID的新兴应用、如何延续传统的PID的生命、如何利用PID连接世界、如何推广PID的应用,以及在PID方面的成功与失败的分享等等。笔者分身乏术,无法参加全部研讨,仅从参加的十几场研讨中总结以下PID在学术社区的发展趋势:

1.PID将渗透到学术出版的每个角落,包括出版工作流中的各个工作环节,以及各种内容、各种元素。如Crossref将DOI用于同行评议时产生的评审报告及其他产出,ORCID也将评审行为纳入研究者的学术活动进行记录;除传统的学术成果外,包括数据、软件、科研项目、会议、基金及授权、科学博客、政策文件及其组成元素、科研工具与设施、合同、科研机构等都已经或即将被赋予PID;

2.继学术出版领域之后,越来越多的学术研究相关的应用都利用PID开展服务,以增加学术成果或研究活动的可见性、可重用性、可度量性。包括学术文献/科研数据的使用跟踪与计量、学术搜索引擎、学术仓储、数据挖掘等等;

3.无论研究者还是服务提供者都需要关注PID,通过多种PID的集成应用促进学术社区实现整体利益,同时需要关注和解决PID应用中的问题。元数据在PID的应用过程中起到关键作用,因此Crossref提出“Metadata 2020”联盟,提倡为所有的研究成果提供丰富的、相互连接的、可重用、开放的元数据,其他演讲者也多次提及元数据促进PID系统的互操作性的作用;PID的持久性,以及多种PID系统的集成、冲突管理等问题也受到了极大关注;

4.“网页点击时代”的PID已发展了二十余年,与互联网的物理地址——IP地址相比,数字对象ID应发展为与IP地址相同层次的互联网公共基础设施,在数据领域完成数字对象交换的任务。美国研究创新研究所(CNRI)发表题为Twenty Years of PID Discussion: Are We There Yet?的演讲,对二十余年来数字对象的PID发展历史和现状、以及未来进行了总结。演讲者将PID的发展历程分为“前互联网时代”——以ISSN/ISBN这种专用系统为代表——以及“网页点击时代”,并重点回顾了1992年以来由两位互联网之父、TCP/IP协议的联合发明人、当时CNRI的主席及副主席——Bob Kahn和Vint Cerf提出的Handle系统的起源及发展,HS作为PID基础设施在1996年孵化了在学术界广泛应用的DOI系统,为DOI提供了注册及解析能力。与互联网的物理地址——IP地址相比,数字对象ID能否发展为与IP地址相同层次的互联网公共基础设施?必要条件包括公共的、可靠的解析架构、开放性非营利性的国际管理实体、可以构建多种应用及商业模式的平台、对于被标识的实体有足够的相关信息以支持理解和应用等。演讲可以说为数据时代的PID从哪里来、向哪里去做了纲领性的注解。

图2:PID与IP地址的对比

另外值得一提的是,在1月23日的研讨中,Crossref、DataCite和ORCID三家机构标识符(Organization ID,简称ORD ID)的主要发起者介绍了机构标识初创计划,首先形象地提出了推动机构标识ID(ORG ID)建设的必要性,阐明其目标是为建设一个开放、独立、非营利性的机构ID注册中心提出组织结构、原则以及技术规范,以促进对研究者所属机构的消岐。目前由机构ID工作组已形成治理原则、产品原则等推荐书,并已经在广泛的研究社区中征询了意见,同时针对启动该开放式登记库所需的数据、服务、及其他资源征求合作方,目前已有22个组织进行了评论/表示兴趣。会上还介绍了1月22日召开的利益相关方会议的情况,主要审议了工作组的工作成果以及相关的意见回复,建立组织结构及管理理事会。有兴趣承办机构ID注册服务的5个组织(大英图书馆The British Library、加州数字图书馆California Digital Library、CrossRef、OCLC、PSI)也向与会者报告了自己的目标、优势等,会议最后讨论了下一步行动计划。看来机构ID已从概念讨论发展到服务的建立阶段,呼之欲出。

图3:建设ORG ID的必要性

在令人眼花缭乱的session之外,PIDapalooza还有活泼的社交和推广活动,因此洋溢着节日的欢快气氛。正如PIDapalooza的Slogan所说:Open identifiers deserve their own festival!期待明年的PIDapalooza能看到更多的来自中国学术界的出版社、科学数据中心、研究者以及PID服务的提供者和开发者!

图4:部分与会者在Girona大教堂前合影

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180222G0IV5A00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券