超25万次引用,谁是21世纪最火论文?

360影视 欧美动漫 2025-05-26 17:07 3

摘要:最近,《自然》杂志发布专题报告,回顾了科学文献数据库中被引用最多的科研论文。根据Web of Science、Dimensions和Scopus等多个数据库提供的数据,他们发现人工智能、提升研究质量的科研软件和方法、癌症统计数据等主题的论文占据21世纪热门论文

图源:GPT 4o

本文来源:神经现实

作者:NR

导读

人工智能、研究软件与方法、癌症与健康相关研究,占据21世纪被引次数最高论文榜单。

● ● ●

最近,《自然》杂志发布专题报告,回顾了科学文献数据库中被引用最多的科研论文。根据Web of Science、Dimensions和Scopus等多个数据库提供的数据,他们发现人工智能、提升研究质量的科研软件和方法、癌症统计数据等主题的论文占据21世纪热门论文榜单[1]。而1951年发表于《生物化学杂志》的一篇描述蛋白质测定方法的论文[2],继续稳坐迄今为止被引次数最多论文榜首

早在2014年,《自然》杂志就已统计过史上被引次数最多的100篇论文[3],他们发现最知名的一些研究并未入选,例如发现高温超导体和DNA双螺旋结构解析等获得诺奖的研究。相反,上榜论文多是生物医学和统计学领域中实用性极强的技术方法,例如Lowry蛋白质测定法、Sanger测序法和PCR等。此外,像BLAST和Clustal这样的生物信息学工具、用于绘制进化树的邻接法、以及Kaplan–Meier和Cox模型等统计方法也位列其中。榜单还显示,计算机的发展推动了这些方法的普及,而工具类软件、数据库和统计模型往往能获得远超基础科学突破的引用量

而在当前《自然》杂志更新的榜单中,排名有一半已经发生了变化,21世纪已有16篇论文跻身历史前50名。值得一提的是,微软研究人员在2015年人工智能会议上提交的一篇论文《用于图像识别的深度残差学习》[4],迅速攀升至历史百大榜单第5名(WoS、Dimensions和Scopus数据库排名中位数分析)。

进一步的分析发现,这篇论文已经成为21世纪以来被引用次数最多的论文。该论文的作者提出了深度残差学习(ResNet)架构,突破性地解决了深层神经网络训练中的信号衰减问题,使网络层数达到前所未有的深度,并在2015年赢得图像识别竞赛。ResNet不仅成为深度学习发展的重要里程碑,也为后续的AI突破——如AlphaGo、AlphaFold和ChatGPT等技术的出现奠定了基础。

不过,不同数据库对这篇论文的引用统计存在差异。谷歌学术将其列为第二高被引论文,引用次数达25.4万,而Web of Science则将其排在第三,引用略超10万。尽管排名不一,在五个主流数据库中,它的中位排名居首。然而,引用次数本身存在诸多不公平因素,例如发表时间较早、所处领域热门等都会带来积累优势。尽管《自然》曾尝试通过计量学方法调整这些影响,但由于入选文章本就引用极高,整体榜单变化不大,仅有部分疫情相关新论文有所上升。

除此之外,人工智能、研究软件与方法、癌症与健康相关研究也进入21世纪被引次数最高论文榜单[5]。AI领域凭借跨学科适用性和迅猛发展势头,多篇关键论文高居榜单,包括2012年开启深度学习热潮的AlexNet、推动大语言模型发展的Transformer架构“Attention is all you need”,以及广泛应用于图像处理的U-Net网络等。开源特性和预印本文化也促进了这些论文的广泛传播。

研究软件方面,定量PCR、RNA测序分析工具DESeq2、结晶分析程序SHELX等被广泛引用。健康类论文中,GLOBOCAN癌症统计报告、癌症标志综述以及DSM-5精神障碍分类指南影响深远。此外,主题分析方法、PRISMA系统综述报告指南、I²统计量等研究质量提升工具也跻身前列,scikit-learn、lme4、G*Power等统计与编程软件的引用量也极高。

总的来看,许多论文因其快速发展趋势在引用上展现出天然优势,还有一些论文更是借助工具性、方法指南或综述性获得超高引用。然而,一个值得深思的问题也浮上水面:为什么原创性的基础研究逐渐淹没在高被引论文中?显而易见的是,引用次数已经不再能够完全评估科研质量及其影响力,或许我们是时候引入新的评价体系了。

21世纪十大高被引论文

01

Deep residual learning for image recognition

用于图像识别的深度残差学习

He, K., Zhang, X., Ren, S., & Sun, J.

发表日期:2016

引用次数:103,756–254,074

这篇论文提出了残差学习框架(ResNet),成功解决了深层神经网络训练困难的问题。通过引入“残差连接”,网络可以更高效地学习相对于输入的变化,使得深度高达152层的模型依然易于优化,并显著提升了图像识别准确率。这一突破奠定了深度学习在计算机视觉领域的关键基础。

02

Analysis of relative gene expression data using real-time quantitative PCR and the 2-ΔΔCT Method

使用实时定量PCR及2-ΔΔCT方法分析相对基因表达数据

Livak, K. J., & Schmittgen, T. D.

发表日期:2001

引用次数:149,953–185,480

实时定量PCR数据常用的两种分析方法是绝对定量和相对定量,其中2-ΔΔCT方法是一种简便实用的相对定量工具。这篇论文介绍了该方法的原理、假设与应用,并补充了两种有助于分析的衍生变体。

03

Using thematic analysis in psychology

在心理学中使用主题分析法

Braun, V., & Clarke, V.

发表日期:2006

引用次数:100,327–230,391

这篇论文系统阐述了主题分析在心理学中的应用,强调其作为一种灵活且易于上手的定性研究方法的重要性。文章呼吁研究者更多关注和规范使用主题分析,认为它在心理学及其他领域的定性研究中具有广泛价值。

04

Diagnostic and Statistical Manual of Mental Disorders,

DSM-5

《精神障碍诊断与统计手册》第五版(DSM-5)

American Psychiatric Association

发表日期:2013

引用次数:98,312–367,800

《精神障碍诊断与统计手册》第五版(DSM-5)是当前全球最广泛使用的精神疾病诊断标准之一。它是对第四版(DSM-IV)及其修订版的全面更新,旨在反映过去十余年中精神病学、心理学、神经科学等领域的最新研究成果。

05

A short history of SHELX

SHELX简史

Sheldrick, G. M.

发表日期:2007

引用次数:76,523–99,470

这篇论文总结了SHELX晶体结构解析软件的发展历程,回顾了其从1976年版本到现代的演进。SHELX系列尽管起源于旧式计算环境,但凭借稳定性、实用性和不断改进,至今仍被广泛应用。

06

Random forests

随机森林

Breiman, L.

发表日期:2001

引用次数:31,809–146,508

这篇论文介绍了随机森林算法的原理与优势。随机森林通过构建多个相互独立、基于随机特征选择的决策树组成分类器,其泛化误差会随着树数量的增加而趋于稳定。该方法在误差率上优于Adaboost,具有更强的抗噪性,并能利用内部估计评估模型性能与变量重要性,广泛适用于分类与回归任务。

07

Attention is all you need

注意力机制即一切

Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., ... & Polosukhin, I.

发表日期:2017

引用次数:56,201–150,832

这篇论文提出了一种全新的神经网络架构——Transformer,完全基于注意力机制,摒弃了以往依赖循环(RNN)或卷积(CNN)结构的复杂模型。Transformer结构简单、并行性强,训练效率显著提高。这一成果标志着注意力机制在序列建模中的巨大潜力。

08

ImageNet classification with deep convolutional neural networks

使用深度卷积神经网络进行ImageNet图像分类

Krizhevsky, A., Sutskever, I., & Hinton, G. E.

发表日期:2012/2017

引用次数:46,860–137,997

这篇论文介绍了深度卷积神经架构AlexNet网络在ImageNet图像分类任务中的应用。为了提高训练效率,作者采用了非饱和激活函数和GPU加速的卷积操作,并通过“dropout”技术有效减少过拟合。在ILSVRC 2012竞赛中,该模型变体以15.3%的Top-5错误率夺得第一名。这项工作开创了深度学习在图像识别领域的新时代。

09

Global cancer statistics 2020: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries

全球癌症统计2020:GLOBOCAN对185个国家36种癌症发病率和死亡率的估算

Sung, H., Ferlay, J., Siegel, R. L., Laversanne, M., Soerjomataram, I., Jemal, A., & Bray, F.

发表日期:2020

引用次数:75,634–99,390

这篇文章基于国际癌症研究机构(IARC)发布的 “GLOBOCAN 2020”数据,更新了全球癌症负担的最新情况。2020年,全球预计新增癌症病例达1930万例,死亡病例近1000万例。女性乳腺癌首次超过肺癌,成为全球最常见癌症,其次为肺癌、结直肠癌、前列腺癌和胃癌;而肺癌仍是癌症死亡的首要原因。预计到2040年,全球癌症新发病例将增至2,840万例,较2020年增长47%。

10

Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries

全球癌症统计2018:GLOBOCAN对185个国家36种癌症发病率与死亡率的估算

Bray, F., Ferlay, J., Soerjomataram, I., Siegel, R. L., Torre, L. A., & Jemal, A.

发表日期:2018

引用次数:66,844–93,433

这篇文章基于“GLOBOCAN 2018”数据,评估了全球癌症负担,并重点分析了全球20个地区的地理差异。2018年全球预计将有1810万新发癌症病例和960万癌症死亡,肺癌在发病率和死亡率中均居首位,但不同国家和地区最常见及致死率最高的癌症类型差异显著,受经济发展水平和生活方式影响明显。

其他高被引论文

11

Preferred Reporting Items for Systematic Reviews and Meta-Analyses: The PRISMA statement

系统综述与荟萃分析的首选报告项目:PRISMA声明

12

U-Net: Convolutional Networks for Biomedical Image Segmentation

U-Net:用于生物医学图像分割的卷积神经网络

13

Electric Field Effect in Atomically Thin Carbon Films

原子级薄碳膜中的电场效应

14

Fitting Linear Mixed-Effects Models Using lme4

使用lme4拟合线性混合效应模型

15

Scikit-learn: Machine learning in Python

Scikit-learn:Python中的机器学习工具

16

Deep learning

深度学习

17

Common Method Biases in Behavioral Research: A Critical Review of the Literature and Recommended Remedies

行为研究中的常见方法偏差:文献批判性回顾与推荐补救措施

18

Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2

使用DESeq2对RNA测序数据的倍数变化和离散度进行调和估计

19

Hallmarks of Cancer: The Next Generation

癌症的标志:下一代

20

Measuring inconsistency in meta-analyses

荟萃分析中不一致性的测量

21

NIH Image to ImageJ: 25 years of image analysis

从NIH Image到ImageJ:25年的图像分析之路

22

Fiji: an open-source platform for biological-image analysis

Fiji:用于生物图像分析的开源平台

23

The PRISMA 2020 statement: an updated guideline for reporting systematic reviews

PRISMA 2020声明:系统综述报告最新指南

24

ImageNet: A Large-Scale Hierarchical Image Database

ImageNet:一个大规模分层图像数据库

25

G*Power 3: A flexible statistical power analysis program for the social, behavioral, and biomedical sciences

G*Power 3:面向社会科学、行为科学与生物医学科学的灵活统计功效分析程序

参考文献

[1] https://www.nature.com/articles/d41586-025-01124-w

[2] https://www.jbc.org/article/S0021-9258(19)52451-6/pdf

[3] https://www.nature.com/news/the-top-100-papers-1.16224

[4] https://arxiv.org/abs/1512.03385

[5] https://www.nature.com/articles/d41586-025-01125-9

来源:人工智能学家

相关推荐