中国对科学出版物的贡献,比你想象的要大!

图片来源:百度图片

原文信息:Qingnan Xie and Richard B. Freeman,“Bigger Than You Thought: China's Contribution to Scientific Publications”,NBER Working Paper NO.24829.

输入

一、引言

从2000年到2016年,中国在物理科学、工程和数学等国际科学期刊上发表的文章数量日益增长,从“小角色”一跃成为主要贡献者。以Scopus文献计量数据库索引的分类地址衡量,中国科学文献占比从2000年的4% 跃升至2016年的18.6%,比例上超过了美国,但这并没有反映出中国对全球科学成果贡献的真正大小。

为什么呢?两点原因:①被广泛使用的地址衡量标准没有对中国学者在海外撰写的、以非中文地址发表的论文给予任何评价。②Scopus数据库排除了在中文期刊上发表的大量论文,这些论文虽然没有国际期刊上发表的论文那么有影响力,但为大量中国研究员提供了新知识和观点,并促进了其传播。

考虑到这些贡献,本文将中文论文调整为“Scopus等效性”,估计出中国对2016年的科学论文有36% 的贡献;在2013年的科学论文中,有约37% 被引用——大约是中国占世界人口或GDP的两倍。

输入

二、如何衡量一个国家对国际科学出版物的贡献

衡量一个国家对科学出版物的贡献的标准方法是:①该国文献仅有其单一国家的地址;②跨国合作的文献,根据文献中国家地址的数量给该国分配一定的份额(如两国合作文献则各占1/2,三国合作文献则各占1/3),国家的份额分配与其地址的数量成比例。

但是,相比于一个地址上有一个研究人员,这种方法可能低估了在一个地址上有多个研究人员的国家的贡献。为解决这个问题,本文通过拥有这个国家地址的作者数量占总作者数量的比例来给一个国家在跨国合作论文中分配份额。考虑到中国研究人员的数量庞大,这对中国的贡献估计略有提高。但更重要的是,按标准地址方法测量的最大缺点并不是忽略了特定国家地址的作者数量,而是忽略了一个国家的研究人员在非本国地址发表的研究成果。

2.1分析工具

N代表一篇文献中作者的数量;A代表一篇文献中作者地址的数量;C代表中国

Ac代表作者的地址是来自中国的;Nc代表名字是中文的

α代表分配给地址和名字的权重,范围是0(只有作者)到1(只有地址)

为了简单起见,本文对地址和名称给予同等的权重。因为中国的地址和名字大幅增加,α的选择对我们测量中国对科学日益增长的贡献影响微小。

2.2统计结果

图1显示了利用改进后的方法对Scopus期刊中中国文献贡献的估计,从红线可以看出,2016年,中国的科学出版物贡献达到23.3%,比用标准方法测量出来的贡献率18%高出5.3个百分点。23.3%这个数字包括三个部分:只在中国发表的论文(蓝线)、中外合作的国际论文(橙线)、无中国地址的华人论文(绿线)。

增长额最大的是只在中国发表的论文,17年间增长了13.83%个百分点。在整个2000年至2016年期间,中国在非中文论文数量上增加了大约220万篇,在Scopus中收录的中文期刊上增加了110万篇。

图2从不同的角度展示了中国在科学文献中扮演的越来越重要的角色。如果一篇论文至少有一个中文地址或中文署名作者,则关联度量为1,否则为0。在一国研究者和他国有广泛合作的程度上,这个关联测量超出了一国论文的加权比例。中国被测量出2000年发表了12.4%的论文,2016年发表了34.5%的论文。

总而言之,图1和图2显示了,21世纪初,中国在国际科学期刊上的代表性在大幅上升,其速度远远超过了专家在2011年所认为的可能性(Kumar和Asheulova曾在2011年预测,到2025年,中国在Scopus上的出版物将远远少于美国)。

2.3通过引用率来测量

在某种程度上,研究人员对带有中文地址或署名的论文的关注程度低于其他论文,图1和图2中的数字夸大了中国对科学的贡献。衡量论文关注度的标准是论文被引用的次数,这取决于被引用次数的同质性,即研究人员有过多地引用具有类似自身特征的研究人员的倾向。

为了衡量中国在引用中的贡献,本文统计了Scopus所有出版物在2000年和2013年发表的期刊文章中被引用的次数,从2000年到2013年,每年使用一个三年的窗口。由此估计了相对于所有论文,具有中国地址或署名的论文引用数量和所占份额。

图3的A图显示了中国论文平均引用次数与全球平均引用次数的比率。2000年,全中文地址的论文只获得了世界平均引用量的29%,这意味着这些论文对世界范围内的研究影响甚微。相比之下,在国外工作或与海外研究人员合作的中国研究人员的论文被引用次数高于世界平均水平。数据显示,2013年的情况有所不同。与全球平均水平相比,中国论文在国际合作论文中被引用的次数增加了70%,而中国研究人员在非中国论文中被引用的次数则趋于全球平均水平。B图转向了中国在全球引用中的份额,包括引用的相对数量和中国论文的份额。中国在全球被引用的比例从2000年的7.4%上升到2013年的19.5%。

最后一项是关于中国在国际科学文献中日益上升的地位的研究,本文作者在《自然》和《科学》杂志上调查了具有中文署名和中文地址文章的比例。从图4可以看出,2016年,这些期刊论文中约有20%的署名为中文,而8% - 9%的地址为中文,远远高于2000年中文姓名或地址所占的比例,其中地址的增长幅度更大。

总之,本文认为,衡量中国对全球科学文献贡献的所有指标都表明,中国的科学贡献远远超出了人们对中国占世界人口或世界国民生产总值所占份额的预期。

输入

三、对中文论文和引用率的考察

这部分考察了未被Scopus收录的中文科学期刊上的文章的增长情况,并对这些期刊上的中文文章和Scopus的非中文文章之间建立了一个转换率,以衡量中国对全球科学的影响。

中文出版物在以英文为主的英文期刊上的增加,可以合理地预期是以牺牲中文科学文章的出版为代价的。历史上,英语作为科学语言在20世纪的传播减少了其他语言的期刊和文章的数量。但中国的情况并非如此。中国知网(CNKI)期刊数据库显示,2000-2016年期间,中国论文数量不断增加,仅仅通过Scopus来评估中国对全球科学贡献的水平和增长,无疑存在很大的遗漏。2007年,中国知网列出了4216种科学、工程和数学类期刊,相比之下,2017年Scopus中仅收录有329种活跃的中文科学期刊。虽然Scopus可能选择了最杰出的中文期刊收录,其余92%的中文期刊没有被收录,但不可否认的是,这些未被收录的期刊中肯定包含一些有用和有趣的科学研究。

图5记录了从1980年到2016年CNKI科学、工程和数学期刊上发表的文章数量(橙线);在Scopus索引的期刊中,CNKI重叠较少的期刊数量(红线);以及Scopus文章的总数(蓝线)。在20世纪80年代,CNKI的文章数量远不及Scopus的文章数量。那时,中国对科学的贡献是有限的,因为它的人均GDP很低,无法支持很多科学工作,而且1966-1976年的文化大革命摧毁了中国的大学体系,并缩减了研究。上世纪90年代,中国迅速重建了高等教育体系,使CNKI上的文章数量与Scopus上的文章数量大致相当。此后CNKI的文章数量比Scopus的文章增加的更多,增长的更快,所以在2016年,这两个数据库收录的文章数量大致相同(160万篇)。

为了更深入地了解CNKI与Scopus 文章之间的关系,本文将Scopus中含有中国地址的文章数量与CNKI文章数量进行了比较,这些文章分别来自12个细分的领域和不同地位的大学。CNKI出版物涉及数学、光学、冶金和仪器,在微生物学方面保持稳定,在肿瘤学和儿科等7个领域有所增长。在最高质量的“985”大学中,研究人员减少了CNKI出版物的数量,同时增加了英文论文的数量;但越来越多的非名牌大学的研究人员保留或增加了CNKI的出版物数量,这可能为顶级研究人员转向国际期刊、同时在英语期刊上发表论文时填补了空白。一些科学家可能也发表过类似的英文文章来接触全球不同领域的研究人员,并以中文发表文章,将研究成果传播给中国的潜在用户——例如,生物医学研究人员向中国医生通报与医学实践相关的研究成果。

然而,中国在国际Scopus期刊和CNKI期刊上发表论文数量一致增长的根本原因似乎是,由于中国在研发、大学教师和工业研究人员方面的大量投资,寻求发表研究成果的研究人员数量大幅增加。从2000年到2016年,以购买力平价计算,中国的研发支出增加了10倍,超过了欧盟的研发支出,并接近美国的水平。与此同时,中国的教师人数增加了一倍多,研究人员人数增加了两倍——(这表明)所有人都必须找到发表研究成果的地方。

3.1内容与影响

如果中文论文的科学内容或影响与英文论文相当的话,则从2016年出版的大致等额的CNKI和Scopus论文中可以推断出,那一年中国承担了约2/3的科学研究工作。但是CNKI的文章没有国际期刊文章那样的质量和影响。读中文的科学家比读英文的科学家少。CNKI的论文比Scopus的论文更短,引用也更少,因此可能会包含更少的知识。中国要求博士生和硕士生发表部分论文以获得学位,这导致了许多论文发表范围狭窄,只能在大学图书馆而不是其他地方的科学期刊上发表。CNKI与Scopus论文的质量差异也很明显,2013年,相比于Scopus论文29%的未引用率,CNKI文章存在44.6%的未引用率。鉴于英语出版物的影响力或质量较高,中国大学为它们的研究人员在这些期刊上发表文章提供了相当大的金钱和升职激励,这促使许多研究人员将他们最好的作品送往海外。

那么CNKI文章相对于Scopus文章在科学贡献方面的价值究竟有多大呢?

本文通过检查Scopus和CNKI数据库中以及它们之间的引用来回答这个问题。Scopus和CNKI都在在他们自己的数据库计算引用。2013年,Scopus期刊上的一篇文章平均被引用9.2次,CNKI期刊上的一篇文章平均被引用2.3次。这表明CNKI文章与Scopus文章相比,基于引用次数的转换率约为0.25(= 2.3/9.2)。

由于两个数据库都不计入来自另一个数据库的引用,本文估计了2013年发表在Scopus和CNKI的中文论文(随机样本)引用的文章的跨数据库引用。我们的计算揭示了引文量的巨大不平衡。CNKI文章引用Scopus中很多文章,但Scopus文章却几乎没有引用CNKI文章。

将这些估计外推到所有2013年的文章中,本文估计2013年Scopus的文章在接下来的三年里从CNKI的文章中获得了3276350次引用,而2013年CNKI的文章从Scopus的非中文文章中获得了l32196次引用。将这些引用添加到Scopus和CNKI中被引用的数量中,就可以将CNKI期刊文章的引用转换率从0.25降低到0.20。

从图6可以看出,通过这一调整,基于加权署名和地址,中国贡献了Scopus全球科学论文的36%,获得了Scopus等效引用的37%,与Scopus等效论文的45%有关联。由于我们的计算忽略了Scopus之外以非中文的语言发表的科学文章,这高估了中国在全球出版物中的份额。但是,由于Scopus收录了许多非英文非中文期刊(14% Scopus期刊是非英文非中文期刊),并且因为没有一个国家在其科学规模上接近中国,这样的调整不会实质性地改变本文的发现,即中国在科学领域的扩张,比你想象的要大。

输入

四、结论

中国是世纪之交时世界上收入最低的国家之一,在不到20年的时间里就成为了科技大国,这在科学史上是一个了不起的发展。中国积极利用新开发的科学资源,将有助于推动科学技术的发展方向进入可预见的未来;鉴于科学和工程知识在现代经济和社会中的作用,中国在发展全球知识经济方面发挥了巨大作用。借用Horace Greeley对美国人的忠告,“年轻人,向西走,和这个国家一起成长”。除非发生巨大的变化,否则科学将向东发展,和中国一起成长。

Abstract:

From 2000 to 2016 China increased its scientific publications in the international journals indexed by Scopus to become the largest contributor to global science, accounting for about 23% of journal articles adjusted for the Chinese share of addresses or names on publications. Publications with all-China addresses contributed the most to the increase, followed by cross-country collaborations and papers by Chinese-named researchers outside the country. The same period also saw a huge increase in scientific publications in Chinese language journals not indexed in Scopus. We estimate that while Chinese language papers gain about 1/5th as many citations as non-Chinese (largely English) papers in Scopus they are so numerous that even valued as making 1/5th the contribution of a Scopus paper, China accounts for 36% of global scientific papers defined as Scopus papers and China language equivalent papers and for 37% of citations to those papers. China's move to the forefront of scientific inquiry makes it a key driver of the direction of scientific and technological progress and of the knowledge-based economies of the foreseeable future.

声明:推文仅代表文章原作者观点,以及推文作者的评论观点,并不代表香樟经济学术圈公众号平台的观点。

香樟经济

学术圈征稿

输入

本期小编:王璐

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181105G0EVVO00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券