首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Nature独家重磅!21世纪被引用最多的论文

21世纪已经悄然走过了1/4,而这前25年对于科研人来说是难忘的,比如首个mRNA疫苗、基于CRISPR的基因编辑技术、希格斯玻色子的发现,以及首次探测到引力波。然而,这些里程碑式成果并未出现在2000年以来被引用最多的学术论文中。

《Nature》新闻团队分析了本世纪被引用次数最多的25篇论文,发现多数高被引论文聚焦于人工智能(AI)、科研方法、系统综述、癌症统计及科研软件等领域。其中,一篇2004年关于石墨烯的论文也入榜,该研究为作者赢得了2010年诺贝尔物理学奖。

由于各大数据库覆盖文献范围不同,引用数据差异明显。《Nature》综合五大数据库的中位排名,评出微软研究团队2016年发表的ResNet论文为21世纪引用排名第一。

ResNet是一种深度残差神经网络,突破性地实现了150层的训练深度,解决了信号衰减问题,是深度学习技术飞跃的关键。

不过,论文引用量的比较存在不公平之处。例如,微软的论文已有十年时间积累引用,且计算机科学本身就是高产领域。《Nature》委托计量学专家进行调整分析,但因入选论文引用量本就极高,结果变化不大。接下来,《Nature》将重点介绍几篇在21世纪脱颖而出的“引用巨作”。

表1. 21世纪被引用次数最多的论文排名

人工智能的崛起

多伦多大学的Geoff Hinton指出,AI论文因覆盖领域广、发展迅速、论文量大而更易获得高引用。他与人合作的2012年AlexNet论文被认为开启了深度学习时代,现为本世纪第8高被引论文;其综述论文排名第16,ImageNet数据集论文排第24。

随后,基于AlexNet结构进行改进的的U-Net论文位列第12,广泛用于图像生成。紧随其后的是微软的ResNet论文居首,而谷歌2017年提出的Transformer架构(“Attention is all you need”)排第7,是ChatGPT等语言模型的基础。

AI领域高引用还因开源共享普遍。排名第6的《随机森林》论文因算法简单、高效、免费而流行。然而,许多AI论文先以预印本形式发布,引用统计存在低估问题。OpenAlex和谷歌学术尝试整合不同版本的引用,推动更准确统计。

科研软件

本世纪被引用次数第二多的论文并非偶然,它就是为“提供可引用来源”而写。论文由Schmittgen撰写,为解决无法引用用户手册的问题而发表,提供了qPCR数据分析的标准公式,已被引用超16.2万次,用于计算基因表达变化。

除此之外,排名第18的DESeq2论文则基于RNA测序数据分析基因表达。第5名的SHELX软件由英国化学家Sheldrick开发,用于解析分子晶体结构,其2008年发表的一篇综述已被引用7–9万次。

癌症与健康研究

三篇高被引论文常见于癌症研究论文的引言部分:

排名第9和第10的是GLOBOCAN项目在2018年和2020年发布的全球癌症统计报告,由世卫组织支持,广泛用于癌症发病率和死亡率数据引用。排名第19的是一篇综述文章,提出了“癌症标志特征”这一概念,简化了癌症复杂性,对该领域影响深远。

此外,排名第4的是《精神疾病诊断与统计手册》第五版(DSM-5),2013年出版,被广泛用于精神疾病的分类与诊断,是唯一上榜的图书。

提高研究质量

心理学家Virginia Braun和Victoria Clarke的2006年论文介绍了“主题分析方法”:这是一种定性研究方法,用于探索从一系列数据(如访谈)中提取出能解答问题的模式。并通过简明的标准帮助学生理解和应用这一方法,进而导致该文成为高被引论文之一。

另一篇旨在提高研究质量的高被引论文发表于2003年,论文揭示了心理学和管理学等领域中行为研究的常见方法偏差,推动了这些领域研究质量的提升。

综述的兴起

21世纪的高被引论文中,一个显著趋势是系统综述和荟萃分析的增加。系统综述通过综合所有能回答问题的严格研究来得出结论,通常还包括荟萃分析,这是一种结合数值结果的统计技术。加拿大渥太华医院的David Moher等人发现,许多系统评价的报告质量较差,缺少重要细节,如治疗对象特征和药物剂量。为此,2009年他们发布了PRISMA声明,提供了27项报告要求,迅速成为标准,且目前排名第11位。PRISMA的引用量难以统计,但如果合并所有版本,可能会排名第一。

统计/编程软件

最后一类高被引论文涉及统计或编程软件。例如,关于scikit-learn的论文获得了超过50,000次引用,排名第15位,描述了一个为Python用户提供机器学习函数的开源库。另一篇关于lme4软件包的论文,介绍了使用R语言分析特定统计模型的方法,排名稍高。还有一篇关于G*Power软件的论文,为生物学家提供计算实验样本量的软件。

然而,R编程软件本身未出现在这些列表上,尽管它在OpenAlex中被引用超过300,000次。这是因为R的开发者推荐引用其网站而未发布研究论文。Max Planck研究所的科学计量学家Robin Haunschild表示:“第一课是:如果你写了一个有影响力的程序,就要写一篇关于它的论文。”

https://www.nature.com/articles/d41586-025-01125-9

主编微信

生命科学综合交流QQ群:681341860

微信学科群:病毒学群,神经科学群、临床医学、肿瘤学科群、硕博交流群和医药投资交流群(微信群审核要求较高,请各位添加赵编后主动备注单位研究方向)

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O0uGW0hevAjTW8_3jlRcCKIA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券