江晓原:影响因子——学术江湖的《葵花宝典》

摘要:读过金庸《笑傲江湖》的人都知道,《葵花宝典》是江湖中神秘的武学秘籍,练成之后威力极大,所以人人争夺,闹得江湖上腥风血雨。但《葵花宝典》有个致命弱点——“欲练神功,引刀自宫”!小说中所有练此“神功”的人一个个身心变异,全都没有好下场。

本文转自“考古研史”,原载《科学外史》。旨在知识分享,如有侵权,敬请联系小编删除。

为什么“影响因子”是《葵花宝典》?

读过金庸《笑傲江湖》的人都知道,《葵花宝典》是江湖中神秘的武学秘籍,练成之后威力极大,所以人人争夺,闹得江湖上腥风血雨。但《葵花宝典》有个致命弱点——“欲练神功,引刀自宫”!小说中所有练此“神功”的人一个个身心变异,全都没有好下场。

正是在这个意义上,“影响因子”可以比作《葵花宝典》:发起这个游戏的西方人和少数西方杂志,已经在这个风靡全球的游戏中大获其利,但中国学术界如果跟着玩这个游戏,其结果必将是“引刀自宫”!

我将持续数篇,为读者讲述这个当今学术江湖中还远远不为人所知的隐秘故事。这个故事包括如下要点:

“影响因子”是用来赚大钱的。用“影响因子”赚大钱的人,如何让世人将他的私人商业公司误认为“国际权威科学机构”?当初是哪些人和杂志发起了“影响因子”游戏,他们又如何从中大获其利?“影响因子”可以如何使用“合法”手段操弄?为何中国学术界跟着玩这个游戏就会“引刀自宫”?

“影响因子教父”尤金·加菲尔德

这次,我们先窥看一些《葵花宝典》中的具体内容——暂不包括“引刀自宫”的骇人场景。

“影响因子”计算公式的第一个问题:两年期限

“影响因子”作为一个专门术语,1955年首次出现在“影响因子教父”尤金·加菲尔德(Eugene Garfield)发表在《科学》(Science)杂志上的一篇文章中:

通过该系统(指“科学引用索引”SCI),可以有效检索收录期刊论文被哪些文章引用过,这在历史研究中将发挥明显作用,当人们尝试评估某项研究成果的意义,或它对同时期的文献或思想产生的影响时,“影响因子”应该比科学家出版成果的绝对数量更具说服力。

加菲尔德最初将一篇文章的被引用次数作为“影响因子”,但八年后的另一篇文章中他把“影响因子”定义修正为“期刊文章的平均被引用次数”。而汤森路透(Thomson Reuters,加菲尔德当初创建的出售SCI和“影响因子”的私人商业公司ISI后被它收购在旗下。2016年ISI又经转卖,新主人是科睿唯安)此后逐年发布的“期刊引证报告”(JCR)上,影响因子算法的标准定义是:

期刊X在前面两年发表的“源刊文本”(source items)在当年度的总被引用数,除以期刊X在前面两年发表的“引用项”(article)总数量,即为期刊X当年度影响因子的得数。其中“源刊文本”,指的是SCI(后来包括SSCI和A&HCI)任一收录期刊上发表的所有文本,“引用项”指学术文本。算式表达为:

这个公式中的第一个问题是:源刊文本的“引用窗口”为什么设定为两年?为什么SCI期刊文本只在发表后第二、三年度发生的引用,才对期刊“影响因子”产生有效贡献?常识告诉我们此后引用肯定还会持续发生的。

加菲尔德1972年发表在《科学》杂志上的文章,对这一设定作了解释,他逐年统计1964-1970年SCI收录期刊的参考文献,其中发表年限在三年内的比例依次为:31.09%、30.24%、26.60%、25.91%、25.32%、25.18%和23.95%。明明两年内的引用只占两三成,但不知何故他就此却得出了“论文被引用主要发生在发表当年后的两年内”的论断。照理说“两年期限”作为“影响因子”算法非常重要的一项准则,加菲尔德有必要单独撰文或至少也应该在文章中详细说明理由,但他却只用一条注释(该文注释29)糊弄过去。难怪一些西方学者感到无从知晓“两年”标准是依据什么得来的。

针对这一问题,格兰采尔(W.Glanzel)和莫伊德(H.Moed)2002年发表的论文已经提供了一个非常有力的反驳案例。他们考察了医学期刊《柳叶刀》(Lancet)和社会学期刊《美国社会学评论》(American Sociological Review),对两刊1980年发表文章在之后十年的平均被引用率进行逐年比较。发现在头三年,《柳叶刀》论文的平均引用率明显高于《美国社会学评论》,但随着年限逐渐累积,到第十年《美国社会学评论》的引用率就大大高于《柳叶刀》了。

这一结果表明,对医学期刊和社会学期刊采用同样的“引用窗口”年限就不合理。医学作为最活跃的研究领域,新旧理论频繁更迭,其中某些成果发表后引发的关注甚至是爆发式的。但在人文领域,新的思想和观点提出后,往往需要等待若干年的“发酵”,才可能引发关注。

这就表明,汤森路透逐年公布的“影响因子”很难说是客观的。然而,在“影响因子”被捧上神坛的今天,学界即使意识到了这一点,也已经别无选择。2003年加菲尔德对这一问题的回应,就完全是一副“木已成舟能奈我何”的架势:“我们不想等若干年后才了解一份期刊的被引用情况。ISI完全有能力计算三年、五年的影响因子,我们甚至有十年、十五年的影响因子数据库,但它们需要单独订阅。”

在这个傲慢的表态中,“影响因子”的合理性是无所谓的,商业利润才是王道。“它们需要单独订阅”,你想知道更多情况,另外再掏钱啊!——别忘了,SCI和JCR数据也都是要花钱向ISI购买的。

“影响因子”计算公式的第二个问题:分母变化

第二个问题出现在“影响因子”计算公式的分母中。作为分母的“引用项”(article)究竟指什么呢?按照加菲尔德最后的定义,“文章”只包括“原创研究论文”(original research paper)和“评论”(review)。

我们中国人特别老实,办学术刊物就只登research paper,至多偶尔登一两篇review;办普及刊物那就根本不会登任何research paper和review。所以对中国人来说,计算公式分母中的“文章”不会有任何问题——它就是一本学术刊物所刊登全部文章的数量。

可是到了洋人那里,情况却完全不同了!许多刊物除了刊登原创论文和评论,还要发表杂志社论、技术通信、通告、读者来信、科学讯息、观察报告、书评、影评乃至科幻小说!如今“影响因子”遥遥领先的几家最知名科学刊物——《自然》(Nature)、《科学》、《柳叶刀》、《美国医学会杂志》(The Journal of the American Medical Association),《新英格兰医学杂志》(The New England Journal of Medicine)等等,无不如此。

在1972年发表于《科学》杂志的文章中,加菲尔德将《自然》、《科学》、《柳叶刀》、《美国医学会杂志》这类刊物上的所有文本都计入算式分母,理由是“全部计入”不失为较为便捷的处理手段;况且“这些期刊上的非学术文本也是潜在的被引用文本”(见该文注释28)。但这种做法对《自然》、《科学》之类的期刊非常不利,它们的排名全都在40名之后。

针对这一情况,在1975年的JCR报告中,加菲尔德对规则作了调整,规定分母项只包括三类“学术文本”:原创研究论文、评论和技术报告(technical notes)。1995年度的JCR报告中分母规则再次调整,“技术报告”也被剔除,只保留“原创研究论文”和“评论文章”两项,这一做法保持至今。“非学术文本”不再计入的理由,已经变成“它们很难获得引用”——后文将表明这并非事实。

分母大幅度减小对《自然》、《科学》这类期刊的“影响因子”产生了神奇的效果,它们的“影响因子”排名全部大幅上升,其中《美国医学会杂志》竟惊人地提升了100位。对此加菲尔德只委婉承认“部分归结于这个原因”。

请注意《自然》杂志——我已经在《科学外史Ⅱ》谈过它刊登的那些科幻小说了,它和“影响因子”之间有着极为微妙的关系,且待后文慢慢道来。

来源:近现代史论一点号

相关推荐