首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Open Access开放获取数据库介绍(一):ArXiv数据库的前世今生

古希腊的亚历山大图书馆始建于公元前3世纪的托勒密王朝时期,是世界上最早的向公众开放的图书馆之一,只要是有阅读能力的人都可以免费阅读馆内书籍。知识对个人开放获取的理念在古希腊时期早已蔚然成风。

当今,各式各样的论文数据库大行其道,商业化模式的形成,使得知识变为一种消费品。据统计,2009年,全国高校图书馆花在爱思唯尔(Elsevier)数据库上的钱达到2600万美元。仅北大一家,在爱思唯尔采购费用就从2008年的54万美元涨到2010年的61万美元。

虽说校内购买的数据库已经足够强大,但身边的抱怨声还是不绝于耳。

这篇论文怎么不能下载?

可以下载啊,但下载要付费,以Dollar结算,折合人民币大概100多块钱,我有几十篇文献要下载,看来这个月要喝西北风了。

难道金钱才是知识传播中最大的壁垒?

为了寻找一丝hope,听听国际上的声音,我节选了联合国教科文组织的2011年发表的布达佩斯宣言,内容如下:

There are many degrees and kinds of wider and easier access to this literature. By ‘open access’ to this literature, we mean its free availability on the public internet, permitting any users to read, download, copy, distribute, print, search, or link to the full texts of these articles, crawl them for indexing, pass them as data to software, or use them for any other lawful purpose, without financial, legal, or technical barriers other than those inseparable from gaining access to the internet itself.

等一下,这里面提到了“open access”,联合国组织支持文献知识资料从公共的互联网上免费获取。

联合国都发话了,现在有没有组织做这件事?答案是肯定的。

本期向大家介绍ArXiv数据库的前世今生。

一、ArXiv数据库的前身

1990年前后,Joanne Cohn开始通过电子邮件将物理预印本以TeX文件的形式发送给同事,但即将发送的论文数量很快就填满了邮箱。Paul Ginsparg认识到需要中央存储,并于1991年8月创建了一个存放在洛斯阿拉莫斯国家实验室的中央存储邮箱,该邮箱可以从任何计算机访问。

看来这真是Free Lunch,但不会仅仅是生日的时候免费吧?

迄今为止,ArXiv数据库都是免费的,请您放心使用。

二、对于ArXiv数据库的顾虑

有的人会顾虑,通过ArXiv数据库可以下载到出版商还未出版的文献,获得100% Fresh的最新文献,但由于未经过同行评议,文献的质量会不会很差。

对于这样的顾虑,我想大可不必。原因在于,ArXiv在知识平台上已经获得很大的影响力。对于学者注册ID并发表文章,永久不会删除。也就是说想在知识圈安身立命,发表错误或者低级的论文,会被同行耻笑,而大多数学者视自尊心和荣誉感为其学术生涯最重要的组成部分。

三、ArXiv数据库使用介绍

ArXiv数据库近年来的发展迅速,文献数量急剧上升。为学者们提供丰富而高质量的免费阅读文献。

图为ArXiv的文献增长趋势截至2018年4月16日,提交总数为1,378,591

来自https://ArXiv.org/stats/monthly_submissions

使用ArXiv数据集,输入网址https://ArXiv.org/即可进入网站首页,在右上方搜索栏中提供“All Papers”,“Titles”,“Authors”,“Abstract”,“Full Text”,“Help Pages”六种检索类型选择,并可以直接搜索ArXiv中文献唯一对应的ID获取文献。

ArXiv分为“Physics”,“Mathematics”,“Computer Science”,“Quantitative Biology”,“Quantitative Finance”,“Statistics”,“Electrical Engineering and Systems Science”,“Economics”七大领域,每个领域中又分为不同的研究方向。

以“Mathematics”为例,进入领域中,可以选择查看最新的文献、最近月份的文献或者指定相应的年份和月份已获得所需。也可直接点击最下方的年份的快捷方式,获取当年的文献。

在高级检索功能中,可以使用“AND”,“OR”,“AND NOT” 布尔逻辑算符,检索指定的文献。

文章信息中包含标题,作者,文献提交时间等信息,并提供PDF及其他阅读格式的下载,在Bookmark功能中还提供了“CiteUlike”,“Mendeley”等诸多文献管理的书签格式,可谓功能强大。

本期介绍了ArXiv数据库的发展及使用方法,相比于一些付费数据库,其庞大可靠的免费资源正在受到更多人的关注。学术研究笃新怠旧,ArXiv提供的预印本资源往往比需要同行评议的传统期刊更新更快。不仅如此,在科学优先权问题上,预印本数据库有着发表速度快的优势。2008年3月25日,中国科学技术大学陈仙辉领导的研究小组第一时间在ArXiv上发表,氟掺杂钐氧铁砷化合物在临界温度43K时也变成超导体,说明ArXiv对于科学优先权获取有着自身独特优势。

人类的科学知识共享过程中,Open Access是人民群众喜闻乐见的好事。在下一期栏目中,我们将继续分享Open Access数据库,敬请期待。

文稿:张楠

编辑:谢友学

审发:吴静四

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180531G0J4I100?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券