Nature独家:21 世纪被引用次数最多的论文和它们伟大原因

360影视 日韩动漫 2025-04-17 11:19 3

摘要:21 世纪的前 25 年产生了一些巨大的科学突破,从第一个 mRNA 疫苗和基于 CRISPR 的基因编辑技术到希格斯玻色子的发现和引力波的首次测量。但是,您不会在 2000 年以来发表的引用次数最多的论文中找到任何描述这些进展。

插图:Chiara Vercesi

21 世纪的前 25 年产生了一些巨大的科学突破,从第一个 mRNA 疫苗和基于 CRISPR 的基因编辑技术到希格斯玻色子的发现和引力波的首次测量。但是,您不会在 2000 年以来发表的引用次数最多的论文中找到任何描述这些进展。

这是《自然》新闻团队对 21 世纪发表的 25 篇引用次数最多的论文的分析结果之一。获得最多引用次数的文章报告了人工智能 (AI) 的发展;提高研究或系统评价质量的方法;癌症统计;和研究软件。然而,2004 年一篇关于石墨烯实验的开创性论文1——该研究为其作者赢得了 2010 年诺贝尔物理学奖——也是 21 世纪被引用最多的研究之一。

引用——作者在文献中承认先前来源的方式——是衡量论文影响力的一种方式。但引用次数最多的论文通常不是最著名的科学发现。相反,这些作品往往描述科学方法或软件,它们是科学家所依赖的主力军。“科学家们说他们重视方法、理论和实证发现,但在实践中,这些方法被引用得更多,”密歇根大学安娜堡分校(University of Michigan in Ann Arbor)研究学者如何引用作品的社会学家米沙·特普利茨基(Misha Teplitskiy)指出。

有多个数据库跟踪学术引文,但它们查看的文档集不同,引文编号也不同。Nature 选择了五个数据库进行分析,并取了它们的中位数排名。这些数据库涵盖了 21 世纪发表的数千万篇论文。

这些是有史以来引用次数最多的研究论文

按照这种方法,21 世纪引用次数最多的论文是 2016 年的一份报告2由科技巨头 Microsoft 的研究人员撰写的关于“深度残差学习”网络 (ResNets) 的文章。这是一种人工神经网络,是支撑深度学习和随后的 AI 进步的受神经启发的算法。该论文描述了一种训练具有大约 150 层的网络的方法,大约是研究人员习惯的 5 倍。ResNet 架构解决了信号在穿过多个层时耗散的问题。这项工作于 2015 年底首次作为预印本发布,当时 Microsoft 研究人员宣布他们使用该方法在图像识别比赛中取得了优异成绩。

ResNets 背后的概念是导致 AI 工具可以玩棋盘游戏 (AlphaGo)、预测蛋白质结构 (AlphaFold) 并最终建模语言 (ChatGPT) 的因素之一。在他们之前,“深度学习并没有那么深入”,该论文的作者之一、现在在剑桥麻省理工学院工作的 Kaiming He 说。

Microsoft 的论文并非被普遍认为是引用次数最多的论文。根据搜索引擎 Google Scholar 的数据,该论文的创建者向《自然》杂志发送了一份引用次数最多的名单,该论文以 254,000 次引用排名第二。根据美国公司 Clarivate 拥有的私人数据库 Web of Science 的数据,它以略高于 100,000 种期刊的索引排名第三。在选定的五个数据库中,Microsoft 的出版物在两个数据库中被引用次数最高,在另外两个数据库中排名第二,在一个数据库中排名第三,使其在所有五个数据库中排名中位数最高(参见“21 世纪引用次数最多的前十部作品”;引用次数最多的著作的完整列表见补充信息)。

等级 (中位数)引文被引频次(跨数据库范围)1用于图像识别的深度残差学习(2016 年,2015 年预印本)103,756–254,0742使用实时定量 PCR 分析相对基因表达数据,并将 2–ΔΔCT方法 (2001)149,953–185,4803在心理学中使用主题分析 (2006)100,327–230,3914精神障碍诊断与统计手册,DSM-5 (2013)98,312–367,8005SHELX 简史 (2007)76,523–99,4706随机森林 (2001)31,809–146,5087注意就是你所需要的 (2017)56,201–150,8328使用深度卷积神经网络进行 ImageNet 分类 (2017)46,860–137,99792020 年全球癌症统计数据:GLOBOCAN 对全球 185 个国家/地区 36 种癌症的发病率和死亡率的估计(2020 年)75,634–99,390102018 年全球癌症统计数据:GLOBOCAN 对全球 185 个国家/地区 36 种癌症的发病率和死亡率的估计(2016 年)66,844–93,433

来源数据库:Web of Science、Scopus、OpenAlex、Dimensions、Google Scholar。有关引用次数最多的 25 部著作的列表,请参阅补充信息

Microsoft 的论文不仅在本世纪发表的论文中大受欢迎。根据为《自然》杂志进行的单独分析,它还出现在历史引用次数的前十名中(参见“这些是有史以来被引用次数最多的研究论文”)。

比较引用次数充满了不公平和不一致。例如,由于 Microsoft 的工作是在十年前发表的,因此它比年轻的论文有更多的时间来积累引用次数。它也在一个领域——计算机科学——正在进行大量的研究。Nature 委托文献计量学家进行了一项分析,以控制其中一些因素,但是,也许是因为只考虑了引用次数极端的文章,类似的论文仍然名列前茅,只有最近关于 COVID-19 大流行的大量引用论文进入列表(参见补充信息)。

在这里,Nature 探讨了一些已成为 21 世纪引文伟大作品的作品。

加拿大多伦多大学(University of Toronto)的计算机科学家杰夫·辛顿(Geoff Hinton)指出,人工智能论文在引用方面具有天然优势,他去年因其在人工智能方面的工作而获得了诺贝尔物理学奖。他说,这一领域的论文与大量领域相关,21 世纪的发展速度极快,论文数量众多。

许多人将深度学习革命归功于一篇论文中描述的工作,在这场革命中,多层人工神经网络揭示了它们的广泛用途3Hinton 于 2012 年合著。它提出了一个网络(后来命名为 AlexNet),该网络在识别和标记图像中对象的比赛中以较大优势击败了其他方法。该论文在 21 世纪榜单上排名第 8,并且是一篇评论论文4Hinton 和他的合著者关于深度学习的论文排名第 16 位。(2009 年的论文5“ImageNet:大规模分层图像数据库”展示了研究人员用来训练分类软件的数据集,排名第 24 位。

在描述 AlexNet 的出版物发布三年后,一篇有影响力的论文报告了对网络架构的修改,导致了 U-net,它需要更少的训练数据来处理图像6。它现在在列表中排名第 12 位。合著者 Olaf Ronneberger 是伦敦 Google DeepMind 的一名研究员,由于该论文的发表,他表示,最终接受该论文的会议几乎拒绝了它,因为它不够新颖。“它仍然是大多数扩散模型中用于图像生成的主要主力,”他说。

紧随这项工作之后,Microsoft 现在引用次数最多的论文问世。2017 年,Google 的研究人员发表了一篇具有里程碑意义的论文7标题为“注意力就是你所需要的一切”,其中介绍了被称为转换器的神经网络架构。这是大型语言模型进步的基础,这些模型通过有效实施一种称为自我注意的机制来为 ChatGPT 等工具提供动力,该机制允许网络在学习模式时优先考虑相关信息。该论文是本世纪引用次数第七多的论文。

一些研究人员表示,机器学习领域许多早期学术著作的开源性质也增加了其引用率。引用次数第六多的论文,标题为“Random forests”8介绍了一种在以前的类似方法的基础上改进的机器学习算法。位于洛根的犹他州立大学的统计学家 Adele Cutler 与其已故作者、美国统计学家 Leo Breiman 合作扩展了该方法。她说,这篇论文很受欢迎,因为它是开源的、免费的、易于使用的。它在现成的情况下也运行得非常好,几乎不需要定制。

许多 AI 论文是在正式同行评审之前作为预印本发布的,这使得计算其引用次数的工作变得复杂。大多数商业数据库要么不跟踪预印本,要么不尝试将其引文与最终同行评审文章的引文合并,这意味着实际引用计数更高。荷兰莱顿大学退休的科学计量学研究员 Paul Wouters 说,随着引用预印本变得越来越流行,数据库可能需要采用新的约定来汇总此类提及。

OpenAlex 数据库(Nature 的本文来源之一)确实尝试通过合并预印本和最终文章来聚合提及,OurResearch 的联合创始人 Jason Priem 说,OurResearch 是一家位于加拿大温哥华的非营利性学术服务公司,开发了该数据库。谷歌学术搜索试图将作品的所有版本分组,并汇总对它的引用,在加利福尼亚州山景城工作的谷歌联合创始人阿努拉格·阿查里亚(Anurag Acharya)说。

这篇 21 世纪被引用次数第二多的论文最终出现在名单上并非巧合:它被明确地写成,以便给研究人员一些可以引用的东西。

大约 25 年前,制药科学家托马斯·施密特根 (Thomas Schmittgen) 提交了一篇论文,其中包括一种称为定量 PCR 的技术的数据,该技术允许研究人员量化样品中的 DNA 量。为了分析他的数据,施密特根使用了技术手册中的方程式。“其中一位审稿人回来说,'你不能在论文中引用用户手册,'”他说。因此,现在在盖恩斯维尔佛罗里达大学的施密特根联系了方程式的创建者,他们一起发表了一篇论文9这可以被引用。

科学的黄金老歌:几十年前的研究论文今天仍然被大量引用

引用次数是:超过 162,000 次,根据 Web of Science 的数据。这足以使 Schmittgen 的论文进入历史引用研究的前十名。

Schmittgen 的论文很受欢迎,因为它的公式为生物学家提供了一种简单的方法来计算响应不同条件的基因活性变化,例如药物治疗前后。一篇论文中描述了一个名为 DESeq2 的软件程序10排在第 18 位,也用于计算基因活性的变化,但使用 RNA 测序数据来做到这一点。

名单上另一篇被高度引用的软件论文(排名第五)是由英国化学家乔治·谢尔德里克 (George Sheldrick) 撰写的,他于今年 2 月去世。他创建了 SHELX 计算机程序套件,以分析 X 射线穿过分子晶体后的散射模式,目的是揭示分子的原子结构。当他在 1970 年代开始这项工作时,“我的工作是教化学,我写这些程序是我业余时间的爱好”,他在十年前告诉《自然》杂志。2008 年,他写了一篇评论论文11他建议在使用任何 SHELX 程序时都应该引用;这项工作现在已经被引用了大约 70,000-90,000 次,具体取决于所查阅的数据库。

在癌症研究论文的引言部分,引用次数最多的三篇论文是熟悉的。其中两篇(第 9 名和第 10 名)是 GLOBOCAN 的 2018 年和 2020 年报告12,13,这是世界卫生组织的一个项目,每隔一两年跟踪一次全球癌症统计数据。GLOBOCAN 数据被研究人员、倡导者和政策制定者使用,他们需要给出特定癌症类型的发病率或死亡率,论文的主要作者、法国里昂国际癌症研究机构的癌症流行病学家 Freddie Bray 说。

第三篇癌症论文(第 19 期)是一篇综述14试图将癌症的复杂性提炼成肿瘤中常见的少数特征。这些“癌症标志”帮助塑造了该领域,合著者、瑞士洛桑路德维希癌症研究所的研究员道格拉斯·哈纳汉 (Douglas Hanahan) 说。

“学生们走过来对我说,'因为这篇评论,我正在学习癌症研究,'”他说。“我觉得自己像个摇滚明星。”

排在第四位的是有时被称为“精神病学圣经”的东西:《精神障碍诊断与统计手册》(DSM-5) 第五版,该手册于 2013 年出版,距上一次迭代已经过去了近 20 年。这本书15描述了分类和诊断精神障碍(包括成瘾和抑郁症)的标准,并被世界各地的研究人员和卫生专业人员广泛使用。DSM-5 是 Nature 唯一列入该列表的书籍,因为分析中的大多数数据库都记录了它。

心理学家弗吉尼亚·布劳恩(Virginia Braun)和维多利亚·克拉克(Victoria Clarke)已经习惯了在他们的论文中只得到少数关于性别和性行为的引用。因此,他们惊讶地看着他们 2006 年的论文16成为本世纪发表的引用次数第三多的文章。“它有自己的生命,”克拉克说。

两人在 2005 年写了这篇文章,当时 Braun 正在英国布里斯托尔的西英格兰大学休假,克拉克在那里工作。多年来,他们一直在尝试教学生“主题分析”,这是一种定性研究方法,用于探索从一系列数据(例如访谈)中解决问题的模式。Braun 和 Clarke 注意到这种方法的定义和描述很糟糕。有时,作者会说“主题出现”——似乎相当神秘——来自他们的研究,并且有一种任何事情都会发生的感觉。那一年,Braun 和 Clarke 写了一篇针对学生的可读论文,解释了主题分析,并包括了一份做好主题分析的标准清单。

前 100 篇论文(2014 年)

论文发表后,研究人员开始将主题分析(如 Braun 和 Clarke 所概述的那样)作为他们使用的方法,这使得该论文的引用次数从图表中脱颖而出。克拉克说,这篇论文“完全改变了生活”。此后,她和 Braun 将大部分工作转向主题分析,并收到了参加世界各地会议的邀请。“这完全是偶然的,”在新西兰奥克兰大学工作的 Braun 补充道。

另一篇旨在提高研究质量的高引用论文于 2003 年发表,描述了使心理学、管理和其他领域的行为研究复杂化的方法论偏见17。该论文的主要作者、佛罗里达大学盖恩斯维尔分校(University of Florida in Gainesville)的商业研究员菲利普·波德萨科夫(Philip Podsakoff)说,作者开始在他们的方法部分引用他的论文,以表明他们已经在工作中解决了这种偏见。他说:“我为越来越多的人意识到进行真正好的调查研究的困难而感到自豪。

被引用次数最多的论文中反映出的 21 世纪的一个趋势是系统评价和荟萃分析的兴起。在系统评价中,研究人员综合了所有可以回答问题的严格研究,例如汇总临床试验是否表明某种药物有效。它们通常包括荟萃分析,这是一种用于组合数值结果的统计技术。

Moher 说,加拿大渥太华医院研究所的临床流行病学家 David Moher 和其他科学家发现,其中许多综述是“粗制滥造的报告”。它们通常缺乏重要的细节,例如试验中接受治疗的患者的特殊特征或使用的药物剂量。2009 年,Moher 和他的同事通过在几家期刊上同时发表 PRISMA 声明(系统评价和荟萃分析的首选报告项目)解决了这些问题18.该论文提供了一份包含 27 项的清单,用于报道此类研究。

PRISMA 很快成为清单上的固定内容,现在在引用次数最多的列表中排名第 11 位。随着系统评价数量的激增,作者引用论文以表明他们遵循严格的方法成为标准。系统评价也被许多领域的研究人员广泛使用,作为理解不断膨胀的研究文献的一种方式。

由于 PRISMA 声明发表在多个期刊上,因此很难跟踪其总引用次数。发表在 BMJ 和 PLoS Medicine 上的版本最常被引用(大约有 53,000-80,000 次引用,具体取决于查询的数据库),但如果所有版本的所有引用都汇总在一起,该论文可能会争夺榜首,根据 Web of Science 数据库,该论文可能会争夺榜首,引用次数约为 138,000 次。

到 2020 年,近 200 家期刊和其他组织已经认可使用 PRISMA,同年,Moher 和他的同事发布了更新版本19的陈述也跃升至引用次数最多的名单(第 23 位)。

研究表明,使用 PRISMA 确实可以提高系统综述报告的质量,但 Moher 承认,一些作者通过引用清单而不是实际按照它的建议去做来“玩弄系统”。

另一种方法已经乘着荟萃分析的尾巴进入了引用次数最多的名单。2000 年左右,当时在英国剑桥 MRC 生物统计部门工作的统计学家 Julian Higgins 和他的同事开始开发一种方法来显示荟萃分析中汇总的研究结果彼此一致的程度——例如,减肥药在不同人群中是否具有相同的效果。这样的统计数据表明,如果药物或其他干预措施在不同的环境中使用,例如在世界的另一个地方,它是否有可能奏效。

论文20根据团队设计的改进统计数据,称为 I2》之所以被高度引用,部分原因是它被纳入了 Cochrane 干预系统评价手册——此类研究的首选手册。但现在是英国布里斯托大学证据综合专家的希金斯说,他看到作者引用了这篇论文,但错误地解读了统计数据。“这在很多方面都非常可悲。被引用是件好事,但当他们误解你想要实现的目标时,就会感到尴尬。

最后一类引用次数最多的论文与统计或编码软件有关。例如,一篇论文21描述 scikit-learn(一个免费的开源库,其中包含用于机器学习的预编码函数和技术,面向 Python 编程语言用户)已获得超过 50,000 次引用(根据 Google Scholar 的数据为 100,000 次),在榜单上排名第 15 位。2015 年的一篇论文22在一个名为 LME4 的软件包上,该软件包用于使用免费编程语言 R 使用特定统计模型分析数据,排名略高于此。

还有另一篇论文23在一个名为 G*Power 的引用率最高的免费程序上,它为生物学家提供了易于使用的软件,用于计算他们的实验需要多大才能获得具有统计意义的结果。

但是科学家使用和提及的最有影响力的程序之一——R 编码软件本身——并没有出现在这些列表中。OpenAlex 记录了超过 300,000 次引用,它所谓的描述 R 的研究工作,但其他数据库都没有记录它。这似乎是因为 R 的开发者建议用户引用一个网站——软件所在的存储库——但从未写过关于它的权威研究论文(见 www.r-project.org)。Priem 证实,OpenAlex 将这些参考文献错误地归类为研究论文。这解释了为什么这项工作出现在 OpenAlex 引文记录的顶部,但在 Nature 检查的其他四个数据库的目录中却没有。

德国斯图加特马克斯·普朗克固态研究所 (Max Planck Institute for Solid State Research) 的科学计量学家罗宾·豪恩柴尔德 (Robin Haunschild) 说,这个例子表明了引文文化和记录是多么反复无常,他为《自然》杂志提供了分析建议。“第一课:如果你写了一个有影响力的程序——写一篇关于它的论文,”他说。

自然 640, 588-592 (2025)

来源:人工智能学家

相关推荐