我国学者通过古诗词研究江豚历史分布区,登上顶刊封面

360影视 日韩动漫 2025-09-06 16:05 1

摘要:——作者用于对比的现代江豚分布地来自水生所的实地调查,与基于古诗词得到的古代江豚分布地相比,不仅是完全不同的调查方法,而且采用的判断标准也完全不一致,数据之间缺乏可比性;

TL;DR:

这篇论文在数据收集、处理、分析、展示和解读等方面均存在问题,其结论并不可靠:

——作者未能有效判断古诗词中提及的「江豚」是否确实是实际目击数据,甚至未能进行基本的数据清理工作(如去重);

——作者对于古诗词地理位置信息的判断方法存疑且部分结果明显有误,使用的经纬度疑似直接套用现代同名地点的坐标而未考虑到时代变迁;

——作者用于对比的现代江豚分布地来自水生所的实地调查,与基于古诗词得到的古代江豚分布地相比,不仅是完全不同的调查方法,而且采用的判断标准也完全不一致,数据之间缺乏可比性;

——作者在列举诗词的朝代分布时,错误地展示了所有744首「提及江豚的诗词」的朝代分布,而非研究中实际用到的362首「提及江豚且能确认地理位置信息的诗词」的朝代分布;

——作者在构造江豚分布地数据时,根据「人类活动对长江流域江豚分布有负面影响」的假设,认为较早朝代的分布地必定包含较晚时代的分布地,最终得到「江豚分布地随时间减少」也即「人类活动对长江流域江豚分布有负面影响」的结论,构成循环论证;

——作者的许多重要结论来自于数据收集的不平衡,如「唐朝至宋朝江豚分布地几乎未减少,清朝至现代江豚分布地大幅减少」的部分原因是,收集的古诗词中,唐朝仅有2首而清朝却高达253首。

我最先对这篇论文的结论起疑,是因为 @佳人李大花 回答中提到,作者收集到唐朝提及江豚的古诗词只有5首,但是唐朝有江豚分布的网格数量却有169个,后者远远超过前者。

同时,根据作者列出的古诗词数量可以发现,总共724首,其中清朝477首、明朝177首、元朝27首、宋朝38首、唐朝5首(这里吐槽一下,作者原文写的是「清朝最多,然后依次是明朝、元朝、宋朝、唐朝」,难道作者认为27>38?),加起来正好相符,这意味着作者在绘制最后一幅现代江豚分布网格图时依赖于另外的数据,那么一个自然的问题是:这些来源不同、统计手段不同的数据之间,是否具有可比性呢?

所以我前天在泛科学群里发了一条质疑:

这个提问里提到的这个论文感觉很有问题啊……
作者原文中说了,他们在唐朝总共就只找到5首诗提到江豚,就算这5首全都包含位置信息,作者又是怎么得出唐朝的时候有169个grid有江豚的?169远远超过5了吧?
我唯一能想到的可能是,唐朝的169个grid表示的其实是「唐朝及之后」的诗词中有在该grid目击江豚的记录;但如果真的是这样的话,那么有江豚出现的grid数量随着时间下降不就是个显然的循环论证吗?
另外,唐宋元明清统计出现地点用的都是古诗词,到了现代用的则不是古诗词(根据作者在列举古诗数量那段给出的724=477+177+27+38+5可知;以及作者不知为何认为27>38),我猜可能是用的实际观测记录吧,但是这两种不同的统计方法之间有任何可比性吗?

虽然 @佳人李大花 的回答里贴了论文正文(论文第一页), @流浪自然 的回答里贴了论文配图(论文第二页),但是都没有解释作者的数据收集或作图方法,我又不想特地花钱去买原论文,所以本来我就打算抛个砖完事儿……

结果这两天我正巧在剑桥大学参加活动,发现用剑桥的无线网络能直接免费访问原文(感谢剑桥图书馆),特别是我看到原文有三个补充材料,那我就不得不接着答了(笑

这三个补充材料分别是:

介绍数据收集和处理方法的PDF文档 包含所有提及江豚且能确认地理位置的诗词的表格 包含所有提及江豚的诗词的表格

这份PDF文档就是本回答分析的重点,让我们仔细地捋一下。

作者进行搜索的两个数据库分别是籍合网( http:// ancientbooks.cn )和中国哲学书电子化计划( http:// ctext.org ),搜索使用的关键词包括「豚」、「江豚」、「豚⻥」、「江豘」、「江猪」、「䱐」和「䱡」。

虽然江豚和白鱀豚的分布范围都在长江沿线一带,但作者认为古人能够正确区分两者,给出的理由包括:(1)东晋时的辞书《尔雅》区分了江豚和白鱀豚;(2)北宋孔武仲在《江豚诗》中指出「黑者江豚,白者白鱀」;(3)古人对白鱀豚的称呼为「鱀」或「」,与江豚不同。

——问题来了:古人 「能够」 区分江豚和白鱀豚,并不代表诗人在创作时 「确实」 区分了江豚和白鱀豚(或其它鱼类);而并非江豚却写成了江豚的可能性包括但不限于:

诗人眼花看错了,把白鱀豚或者其它鱼类当作了江豚; 诗人没看错但看到的不是江豚,只是为了押韵或对仗或用典等等而使用了江豚这一意象; 诗人压根什么都没看见,出于同上的理由而使用了江豚这一意象。

——具体来说,「江豚拜(浪)」、「江豚吹浪」、「江豚跋扈」这三类用典频繁地出现,占据了所有入选诗词的很大一部分,诗人在创作这种诗句时是否真的看到了江豚相当存疑;

——至于清代刘肇堂《新滩》「江豚来舟前,潜虬伺舟后」、清代朱方蔼《夜半风雨忽止,潮平月上,舟人渡江前发,喜而作歌》「江豚罢舞龙稳睡」等将江豚和现实中根本不存在的传说生物「虬」、「龙」相并列的诗句,则更是几乎可以断定诗人仅仅是在追求对仗,而非真的目击了江豚。

——再例如清代李基塙《金山歌》,开头两句就是「不成金山游,还为金山歌」,明明白白地写着诗人根本就没有去金山,就更谈不上目击江豚了。

考虑到单个汉字(如「豚」)可能有多重含义,作者手动检查了收集到的诗词,并排除了不符合「江豚」含义的诗词。举例而言,在《全唐诗》中可以找到23首包含「江豚」或「豚鱼」的古诗,作者仅保留了其中的4首诗,另外的19首中「豚」通常和鸡等家禽一同出现,更有可能是指猪。

经过手动筛选,作者保留了724首提及江豚的古诗词,然后根据诗人确定诗词创作的年代,再根据诗词标题和内容中提及的地名,比照《中国历代户口、田地、田赋统计》(梁方仲编著),确定了诗词创作的地理位置:例如,韩愈的诗显然创作于唐朝;韩愈《岳阳楼别窦直》的标题说明这首诗创作于湖南岳阳;(未指明诗人的)《游金山》说明这首诗创作于金山;最终能够确定地理位置的有362首。

——我大概浏览了一下第2个表格(包含362首提及江豚且能确定地理位置的诗词),至少发现了以下四个问题:

——其一,作者给出的列表有重复:如第160行和第162行均为清代郑炎《扬子江望金山》,第165行和第174行均为清代李调元《游金山寺/游金山》(仅标题不同),第192行和第194行均为清代洪亮吉《苏慕遮·醉题焦山月波台》;类似的重复还有多处,甚至有如清代杨豫成《舟中大风》这样重复了三次的。

——其二,作者对部分重复的诗词给出了不同的标注地点,有些甚至相隔甚远:如清代郑炎《扬子江望金山》被分别标注为镇江金山和镇江京口;清代宋琬《人日发皖城》被分别标注为潜山和安庆,经度差了0.5度,意味着这两个标注地点落在不同的网格;明代李先芳《九江》被分别标注为九江瑞昌和九江湖口,经度差了0.6度,也是不同的网格;另外有一组特别值得一提:第2行唐仲实《程仲庸游京口留金山寺》和第358行唐桂芳《和程仲庸游京口留别》,实为同一首诗,但是在表格中却是诗题不同、诗人名字不同、标注地点不同(镇江金山/镇江京口)、年份不同(1340/1330)、朝代不同(明/元)的两首诗。

——其三,作者给出的标注地点方法存疑且可能有误:如清代费承勋《满江红》的地点被标注为镇江金山,但实际上该诗首句为「浮玉峰头」,查阅资料可知,因四面环江而有「江中浮玉」之称的其实是同为「镇江三山」的焦山;又注意到清代郑炎《扬子江望金山》的首句为「浮玉峰前卷白波」,那么有两种可能:一种是金山也曾经因四面环水被称为「浮玉」(金山直到道光年间才和陆地相连),也即「浮玉」一词可能有歧义;另一种是郑炎诗中指的就是焦山,只是标题只提及了「金山」而已;再如清代杨豫成《舟中大风》的地点被标注为滕王阁,但其末联「前途便是滕王阁,作序无才愧此行」完全可能是用典虚指,即使要解释成实指,那么也只能认为诗人是在去滕王阁的途中而非已经抵达滕王阁;再如清代李绂《章江夜泊同巨州巨山用王子安滕王阁韵二首》的地点也被标注为滕王阁,然而根据标题可知该诗只是用了《滕王阁诗》(滕王高阁临江渚)的韵,正确的标注地点应该是诗题开头的「章江」才对。

——其四,作者或许能够根据《中国历代户口、田地、田赋统计》一书去匹配古代地名,但是查阅该书可以发现,该书仅提供了中国历代各地方州县的人口/田地/田赋收入的统计数据,并未提供地理数据,作者又是如何通过古代地名判定其经纬度(并准确到网格尺寸也即0.3度)的呢?由于时代变迁,一些地名可能历史上曾经历过多次设立和/或撤除,不能简单地用现代同名的行政区划所在经纬度作为替代;再比如,我记得去滕王阁游览时得知,滕王阁因为历代屡次重修(其中包括明代7次、清代13次)的缘故,位置大概已经相对原址移动了十数里之多,然而无论是明代还是清代的诗词,作者给出的滕王阁坐标都是现今滕王阁的位置,其准确性同样存疑。

作者接下来解释了现代江豚分布地点数据的来源:

1978年至2000年期间,作者所在的机构(中科院水生生物研究所,简称「水生所」)对长江流域江豚的分布进行了63次调查,总计时间达800天,共收集到435次目击数据。这些调查将长江、洞庭湖、鄱阳湖及相应支流分成21个区域,由两艘约30米长的船只对各区域同步进行搜索。

作者还很贴心地给出了关于这些调查的参考文献:

Zhao, X., Barlow, J., Taylor, B.L., Pitman, R.L., Wang, K., Wei, Z., Stewart, B.S., Turvey, S.T., Akamatsu, T., Reeves, R.R., et al. (2008). Abundance and conservation status of the Yangtze finless porpoise in the Yangtze River, China. Biological Conservation 141 , 3006–3018. https:// doi.org/10.1016/j.bioco n.2008.09.005 .

这参考文献不给不要紧,你给了我肯定要去看,这一看就看出问题来了……

请看下面这张截图:

这张截图显示的是在1978-2000年间水生所调查是否有江豚分布的研究范围,让我们拿这张图对比一下新论文中的图E(清朝江豚分布)和图F(现代江豚分布),可以立刻发现:

一方面,水生所历次调查的研究范围,和图F中判定存在江豚分布的网格范围基本吻合(只差了汉江);

另一方面,从图E到图F少掉的一大堆网格,同时也是论文其中一个重要结论「清朝至现代期间长江江豚分布显著下降」的主要依据,有相当一部分根本不在水生所历次调查的研究范围之内!

当然,参考文献中也意识到了这方面的问题,并给出了解释:

We did not cover tributaries because most of them are unlikely to be viable habitat(Xiao and Zhang, 2002; Yang et al., 2000; Zhang et al., 1993). We also did not cover any small side channels that were considered unnavigable.

机翻:
我们[的调查]没有涵盖支流,因为其中大多数不太可能是[江豚]可行的栖息地(一些参考文献)。我们也没有涵盖任何被认为不适宜航行的小型侧流水道。

对于这篇参考文献来说,这个解释勉强算是合理的,因为该论文的主旨是估计江豚种群的数量,所以把一些不太可能有江豚存在的支流/侧流水道排除在外问题不大,大不了在结论中加一句「由于排除了一些区域所以估计值应当视为种群数量的下限/可能有一定的低估」。

但是当这个现代江豚分布范围从参考文献中被借用到新论文的时候,这个解释就有点不合理了,因为新论文研究的就是「某个地点是否过去有而现在没有江豚」,作者在花了大功夫确认某地「过去有」江豚之后,却轻飘飘地用另外一篇论文二次引用的结论来论证某地「现在没有」江豚(甚至都算不上是「论证」,而是直接划了个等号说「认为现在大概率没有」=「现在没有」),实在是无法让人信服。

而且这个解释相当于直接「得到」了新论文的另一个重要结论,即「长江干流分布地减少33%,支流和湖泊分布地减少了91%」:水生所的历次调查明确地表示他们没去调查支流和侧流水道,而是主要调查了干流,那可不是「干流分布地小幅减少,支流分布地大幅减少」吗?

最后,作者解释了如何从各朝代古诗词的江豚目击点得到相应的分布地网格分布;

首先,在目击点的基础上,作者使用最小凸多边形法(Minimum Convex Polygon, MCP)把目击点都连接起来;

其次(如我所料的),作者认为较早时期的分布地应该包括所有较晚时期的分布地,因为「长江流域的人类活动随时间逐渐增强,对江豚的分布造成了负面影响」;

最后,作者认为如果江豚分布在了某个水系的上游,则一定也会分布在其下游,因为「下游食物资源更充足、水流速度更慢」。

——然而,作者的这一连串假设意味着,其最主要的结论,即「江豚分布地随时间逐步减少」,几乎完全、直接来自其假设:作者根据「人类活动会对江豚分布有负面影响」的假设进行了数据处理,然后根据处理过后的数据得出「人类活动会对江豚分布有负面影响」,这是赤裸裸地循环论证。

——同时,另一个结论「唐朝至宋朝期间江豚分布地几乎没有减少,清朝至现代江豚分布地大幅减少」,显然也并不完全是由于江豚分布地的实际变化,而起码有部分是因为「提及江豚且能够确认地理位置的362首诗词中,唐代仅仅只有2首,清代却多达253首」。

——这里顺带一提,原论文在列举数据时也存在问题:实际用于研究的其实不是共724首「提及江豚的诗词」,而是共362首「提及江豚且能确认地理位置的诗词」,那么作者在列举诗词的朝代分布时,难道不应该是给出后者的朝代分布而不是前者吗?这里我来替作者列举一下:在这362首中,唐朝2首,宋朝21首,元朝14首,明朝72首,清朝253首。

总之,尽管这篇论文有一个很好的噱头,但是其数据收集、处理、分析、展示和解读的过程根本经不起细究;各位读者看个新鲜好玩也就罢了,如果真的认为能够「通过古诗词研究江豚分布的时代变迁」,还是早点洗洗睡吧。

来源:金钱猎人一点号

相关推荐