非人灵长类动物中依赖上下文的物体序列的灵活学习与重新排序

360影视 国产动漫 2025-05-10 23:33 10

摘要:摘要智能行为涉及以新颖的方式在心理上重新排列已学信息,这种能力在人类中尤为发达。虽然非人灵长类动物(NHP)能够学会将新物品按复杂顺序排列,并在该顺序中重新排列相邻的物品,但它们是否能够更灵活地将物品重新分配到非相邻位置仍存在争议。这种心理上的重新索引是通过对

本文来源:CreateAMind

Flexible Learning and Re-ordering of Context-dependent Object Sequences in Nonhuman Primates2024.11.24.625056.full.pdf

非人灵长类动物中依赖上下文的物体序列的灵活学习与重新排序

摘要
智能行为涉及以新颖的方式在心理上重新排列已学信息,这种能力在人类中尤为发达。虽然非人灵长类动物(NHP)能够学会将新物品按复杂顺序排列,并在该顺序中重新排列相邻的物品,但它们是否能够更灵活地将物品重新分配到非相邻位置仍存在争议。这种心理上的重新索引是通过对经验潜在时间结构的推断实现的,而不是通过学习物品与物品之间的串行关联。在此研究中,我们测试了恒河猴进行灵活心理重新索引的能力。受试者学会了按顺序排列五个物体。背景环境的变化提示物体顺序发生了变化,测试受试者是否能够将物体重新排列到已学序列结构中的非相邻位置。结果表明,受试者成功利用背景线索主动将物品重新索引到新的非相邻位置。当初始顺序在更高层次上被学习时,心理重新索引的可能性更大,并且随着对重新索引规则的经验增加而提高,同时与延迟匹配样本任务中的工作记忆表现相关。这些发现表明,非人灵长类动物能够推断出超越物品间简单链式关联的潜在序列结构,并在该结构内重新排列物品。研究结果的模式表明,非人灵长类动物形成了其经验的非空间认知地图,这是许多序列化行为(包括交流、计数或觅食)中灵活心理操作的关键特征。

关键词 :序列学习;认知地图;模式学习;认知灵活性;注意力;工作记忆

引言

心理灵活性指的是以新颖方式安排思想或行动的能力。许多序列化行为(包括交流、计数、问题解决和觅食)都需要灵活的心理操作(Davis 和 Pérusse,1988;McNamee 等,2021)。这些序列化行为的一个共同点是,当受试者能够推断出潜在的时间结构时,这种行为会变得更加复杂和灵活,从而可以在该结构上进行心理操作。推断潜在时间结构并在该结构内重新排列表征的能力是智力测量的基础,并且在人类中相较于非人灵长类动物(NHP)尤为发达(Dehaene,2021;Passingham,2021)。然而,非人灵长类动物在推断抽象时间结构方面的能力如何,以及它们是否利用这种能力来灵活指导心理操作,仍然是一个有争议的话题(Dehaene 等,2015;Whittington 等,2022;Passingham 和 Lau,2023)。

测试受试者如何从经验中推断潜在结构的强大范式涉及物品的序列化排列(Conway 和 ChrisTiansen,2001;Terrace,2005)。使用序列学习范式的研究表明,非人灵长类动物能够理解多物品序列中物体的相对序数位置(Damato 和 Colombo,1989,1990;Chen 等,1997;Orlov 等,2000;Jensen 等,2019;Mione 等,2020;Ferhat 等,2022;Jensen 等,2022),能够在序列中交换相邻物体的位置(Matsuzawa,1985;Scarf 等,2011),并能够反向播放三物品序列(Xie 等,2022;Tian 等,2024)。尽管这些能力表明非人灵长类动物在操作排序项目时表现出心理灵活性,但它们也揭示了与人类相比的局限性,即非人灵长类动物难以从物品序列中提取超出串行链式关联和秩序关联的潜在时间结构(Dehaene 等,2015;Zhang 等,2022)。例如,将序列 A-B-C 反向播放为 C-B-A 的能力涉及将物品重新索引到新的位置(Tian 等,2024),但这种重新索引可以通过交换序列中相邻物品的相对秩序实现,而无需表示抽象的时间结构或物品可以灵活分配的序数位置(Kao 等,2020)。

在此研究中,我们着手测试非人灵长类动物在 5 物体序列中对彼此非相邻物品进行心理重新索引的能力。非人灵长类动物学习了 A-B-C-D-E 的物体序列,并被要求将非相邻物品 B 和 D 重新排列为新的 A-D-C-B-E 序列。物品在不同时间位置上的重新排序可以通过独立表示特定的物体项目及其潜在的序数结构来实现,物品可以被分配到该结构中(Tian 等,2024)。在计算模型中,经验环境的潜在时间结构可以被推断并表示为一种非空间的认知地图,其中包含物品的位置,这使得物品可以灵活地重新索引到认知地图的不同位置(Behrens 等,2018;Whittington 等,2022)。

我们使用 3D 渲染物体测试了四只恒河猴在触摸屏亭站(位于其家庭笼中)上的物体序列学习和灵活重新排序能力(Womelsdorf 等,2021)。该范式要求非人灵长类动物在试验中按照预定的顺序选择同时呈现的物体,每个试验最多允许十五次选择以完成序列并获得液体奖励(图 1A)。当一个序列完成后,或达到十五次选择的最大限制时,受试者会被呈现一个新的试验,其中相同的物体被重新排列到新的位置,以防止使用空间策略。每个序列总共显示十五次试验。对于每次正确选择物体,受试者会立即获得视觉反馈(黄色光环;错误选择:灰色光环)以及滑块位置的增量(错误选择:重置),这表明他们距离获得液体奖励还有多少步骤(见图 1A 和补充视频)。在完成十五次相同序列的试验后,我们将背景(上下文 1)更改为新背景(上下文 2),其中显示相同的物体,但需要一个新的预定顺序,物体 B 和 D 交换位置。每对上下文 1/上下文 2 序列使用了一组独特的物体。每个会话在早期区块评估多个序列对,随后进行延迟匹配样本任务,接着在晚期区块评估多个序列对(图 1B)。

我们发现,受试者能够快速学会完成 5 物体序列 A-B-C-D-E。当背景上下文发生变化以指示相同的物体被重新排序为 A-D-C-B-E 时,他们平均能够预测物体 B 和 D 的交换位置,并在第二个序数位置选择物体 D(图 1C)。这种主动交换更可能发生在初始序列被更好掌握的情况下,并且与工作记忆表现呈会话级别的相关性。这些发现表明,非人灵长类动物能够有效地利用上下文线索,将物体心理重新索引到潜在的时间结构中。

结果

快速学习物体序列

我们在 31.25 次实验会话中测试了四只非人灵长类动物(NHP)的序列学习能力(受试者 B:13 次;J:40 次;K:59 次;S:13 次)。受试者在 5.34 ± 0.37 次试验内学会了完成 5 物体序列,错误选择次数不超过 10 次(受试者 B:9.55 ± 1.62;J:6.88 ± 0.68;K:3.61 ± 0.34;S:5.18 ± 0.93)(图 1C)。在所有序列中,受试者成功学习了 88% 的序列,达到了 80% 的完成标准(受试者 B:80;J:87;K:93;S:92)(补充图 S1A,B),在每个序数位置上都达到了高于随机水平的准确率(补充图 S1C,D)。学习逐渐通过序数位置推进,在平均 1.03 次试验后达到第一个序数位置的 80% 完成率(± 0.03,95% 置信区间),在第 2 至第 5 序数位置分别在 1.30(± 0.11)、2.06(± 0.25)、2.98(± 0.39)和 4.24(± 0.53)次试验后达到 80% 完成率(图 1D, E)。学习是通过减少对物体的错误选择实现的,而表现出固执倾向或违反任务规则的错误在整个过程中很少发生(补充图 S1E,F)。反应时间随着序数位置逐渐增加,这与之前的研究一致(补充图 S2)(Colombo 等,1993)。

受试者主动重新排序已熟练掌握的物体序列中的非相邻物体

接下来,我们测试了受试者是否能够将已学序列 A-B-C-D-E 中的物体重新分配到不同的位置。当受试者完成了初始序列的 15 次试验后,我们将背景上下文更改为新的上下文 2,并将相同的物体重新排列为新顺序 A-D-C-B-E。在上下文 2 中,物体 B 和 D 的位置发生了交换(图 2A,见补充视频)。受试者成功利用上下文变化作为线索,并适应了上下文 2 中的交换,在平均 2.91 次试验(± 0.61,均值 ± 95% 置信区间)后达到了 80% 的完成率,相比之下,在上下文 1 中学习初始序列需要 5.34 次试验(± 0.73)(图 2B)。在上下文 2 中更快的学习速度在每个受试者身上都很明显(上下文 1/2 的序列完成率分别为:受试者 B:5.38(± 0.83)/ 3.85(± 0.73);J:4.71(± 0.53)/ 2.67(± 0.31);K:2.98(± 0.26)/ 1.97(± 0.17);S:5.38(± 0.87)/ 3.08(± 0.52))(图 2C)。在上下文 1 和 2 中,反应时间在各个序数位置上相似(补充图 S2)。

受试者如何适应上下文 2 中物体 B 和 D 的交换位置?

一种串行链式框架预测,受试者会在第二个序数位置错误地选择物体 B,并通过在第三序数位置选择下一个相邻的物体 C 来调整这一错误,因为 C 的相对位置最接近第二个位置。与此串行推理不同,受试者也可能在第二个序数位置主动选择物体 D。这将表明他们理解了 D 在上下文 1 中被索引到绝对第四位置,并且需要在上下文变化时重新排列为新的 A-D-C-B-E 序列。我们发现,总体上,受试者更可能将物体 D 从上下文 1 的第四序数位置重新索引到上下文 2 的第二序数位置,而不是选择在上下文 1 中占据相邻第三位置的物体 C。

首先,我们在达到完成率之前分析了上下文 2 中的选择。当受试者在上下文 2 中错误地选择物体 B 时,他们更有可能正确选择物体 D,而不是物体 C(Welch's t 检验,p = 6.2 × 10^-9)(图 2D)。这种在上下文 2 中对物体 D 的正确重新索引更可能发生在上下文 1 中的初始序列 A-B-C-D-E 达到 ≥80% 完成率的情况下(图 2E)。当上下文 1 的完成率低于 80% 时,受试者同样经常采用正确的重新索引策略(在第二位置选择物体 D)和错误的串行推理策略(在第二位置选择物体 C)(图 2E)。

接下来,我们直接量化了受试者是否利用上下文线索主动交换物体,即——在正确选择 A 后——他们是否在未达到 80% 完成率之前预计在上下文 2 的第二序数位置选择物体 D,而不会错误地选择物体 B。我们发现,与上下文 1 相比,在上下文 2 中,受试者更可能选择物体 D 和物体 C,而不是物体 B(t 检验,p

为了进一步测试受试者是否认为物体 D 是在上下文 2 中被交换到第二序数位置的正确物体,我们计算了他们在正确选择 D 后选择物体 C(正确)而非物体 E(错误)的可能性。受试者在上下文 2 中正确选择 D 后更可能选择物体 C,而不是物体 E,这表明他们将 D 交换到了更早的位置,而不是跳转到他们在上下文 1 中学到的 D-E 序列的后半部分(图 2H)(Welch’s t 检验,p

序列记忆和规则记忆提升交换能力

在序列中交换物体的位置依赖于从记忆中回忆原始序列以及对交换规则的理解。为了测试长期记忆如何影响交换表现,我们将每个实验会话分为早期序列学习、随后穿插的延迟匹配样本任务以及晚期序列学习(图 1B)。在晚期学习阶段,我们重复了早期阶段的一部分序列对,并测试了早期序列是否被记住,以及这种记忆是否可能促进晚期阶段中重复序列的表现和交换可能性。我们发现,重复序列的学习速度比会话早期展示的初始序列或会话晚期穿插的新序列更快(达到 80% 完成率所需的试验次数:早期新序列:4.12(± 0.63;均值 ± 95% 置信区间);晚期新序列:4.74(± 0.80);重复序列:1.81(± 0.37),图 3A;补充图 3)。主动交换的可能性在早期序列中已经高于随机水平,并且在重复序列中没有进一步增加(新早期 vs. 重复:p = 0.0818;新早期 vs. 新晚期:p = 0.0998;重复 vs. 新晚期:p = 0.6962;图 3B)。然而,在重复序列中,受试者在上下文 2 中更有可能在错误选择物体 B 后进行回溯性交换,将物体 D 放入第二位置(新早期 vs. 重复:p = 0.0008;新早期 vs. 新晚期:p = 0.0019;重复 vs. 新晚期:p = 0.3462;图 3C)。因此,序列记忆提高了受试者在未能主动将物体 D 交换到第二序数位置时的错误纠正能力。

接下来,我们分析了会话早期对初始序列的记忆深度是否影响了该序列在会话后期的交换表现。我们发现,当序列在会话早期被更好地记住(即完成率更高)时,受试者在会话后期更可能在上下文 2 中主动将 D 交换到第二位置(R²:0.02,p = 9 × 10⁻⁸)(图 3D,E)。同样,在上下文 2 的第二位置错误选择 B 后,回溯性交换物体 D 的可能性在会话后期也更高,前提是初始序列在会话早期被更好地学习(R²:0.0082,p = 0.0013)(图 3F,G)。

除了对序列的记忆外,受试者还可能改善对交换规则的记忆,该规则要求在背景变化后交换第二和第四序数位置。我们通过量化主动交换和回溯性交换在会话中的变化来分析规则记忆。主动交换在第一次实验会话中就已经显现,并随着会话逐渐增加(R²:0.0089,p = 0.0007;图 3F),而回溯性交换的可能性在会话中保持相似(R²:0.0138,p = 0.1917)(图 3I)。

物体位置的主动交换与工作记忆相关

从较后和较前的序数位置交换物体可能涉及将原始物体的位置索引暂时存储在临时变量中,这类似于短期记忆缓冲区(Tian 等,2024)。因此,我们假设工作记忆能力可以预测主动交换的表现,我们通过评估同一行为会话中的延迟匹配样本任务表现来测试这一点,这些会话也同时评估了交换能力(图 4A,补充图 S4)。我们发现,工作记忆表现与整体序列学习准确性无关(图 4B),但工作记忆准确性与主动交换能力在会话级别上显著相关(图 4C)。这一结果表明,在上下文 2 中成功交换物体 D 和 B 不仅受到长期序列记忆和规则记忆的影响(图 3),还受到在短期工作记忆中保持物体活跃的能力的影响。

接下来,我们测试了学习序列时的背景记忆是否会影响交换行为。当一个序列在工作记忆任务后重复出现时,它会呈现在与初始新序列相同或不同的背景上下文中。我们发现,当背景相同时,重复序列的学习表现优于早期(初始)序列(Welch's t 检验,p = 0.0079;图 4D)。然而,这种整体的背景促进作用并未调节上下文 2 中的主动交换或回溯性交换(主动交换:Welch's t 检验:p = 0.1269;图 4E;回溯性交换:Welch's t 检验:p = 0.3001;图 4F)。

讨论

我们发现恒河猴在单次实验会话中能够学习多个 5 物体序列(图 1,补充视频)。当背景变化表明非相邻物体 B 和 D 交换位置时,受试者更可能交换这些物体,而不是选择序列中下一个排名的物体 C(图 2D-G)。这种交换既发生在主动的情况下,即在犯错之前(图 3B,D,H),也发生在回溯性的情况下,即当受试者在上下文 2 的第二序数位置纠正对 B 的错误选择时(图 3C,E,I)。与更好的交换表现相关的有四个因素:当序列在紧接的前一个上下文 1 中以更高熟练度水平学习时,上下文 2 中的交换更可能发生(图 2E);在上下文 2 的重复序列中,当上下文 1 在会话早期约 30-60 分钟前以更高熟练度水平完成时,交换表现更好(图 3D-G);当交换规则在实验后期被更多会话执行时(图 H);以及当受试者表现出更高的工作记忆表现时(图 4C)。综合来看,这些结果表明恒河猴在序列学习过程中推断了物体的潜在时间顺序,并能够在新背景指示将物体重新分配到新的时间位置时,灵活地将物体身份索引交换到该潜在顺序中的绝对位置。

交换行为反映了物体关联的灵活心理重新索引

成功的主动交换行为表明,猴子利用交换序列的背景作为线索,将在上下文 1 中的 A-B-C-D-E 序列重新排序为上下文 2 中的新 A-D-C-B-E 顺序。最近的一项实验提出了这种线索触发的重组过程的神经相关性,该实验要求非人灵长类动物反向播放 3 物体序列的空间顺序(Tian 等,2024)。前额叶皮层的一组神经元表征了正向空间 3 物体序列 A-B-C,并在视觉线索要求反向报告序列时重新编码了该序列。在重新编码过程中,前额叶皮层的神经群体活动暂时编码了交换后的物体位置,随后一组新的神经群体编码了反向序列(Tian 等,2024)。尽管这些神经发现仅限于交换相邻物品,我们认为它们提供了一个通用框架,用于概念化我们研究中物体交换到非相邻位置的过程。特别是,这一框架预测,在我们的研究中,上下文 1 中 A-B-C-D-E 序列的物体将由表征其序数位置的神经元进行编码(Xie 等,2022)。当背景发生变化,物体 D 和 B 需要交换时,物体 B 和 D 的原始索引被暂时存储在短期缓冲区中,原始 A-B-C-D-E 序列被重新配置为新的 A-D-C-B-E 序列。当这一操作完成后,临时缓冲区不再需要,交换后的序列由一组部分不同于编码初始序列的神经元进行编码(Tian 等,2024)。这一框架的关键见解在于,交换操作可以被理解为将物体重新索引到序列的绝对序数位置。这种索引操作要求物体和时间顺序结构在执行此操作的神经网络中独立编码,这一点得到了神经生理学证据的良好支持(Xie 等,2022;Tian 等,2024)。我们的研究表明,非人灵长类动物在学习将物体重新索引到非相邻位置时利用了这些神经过程,这扩展了先前的研究成果,并记录了心理操作的高度灵活性。

物体位置的心理重新索引与工作记忆能力相关

我们发现,当受试者在延迟匹配样本任务中表现更好时,上下文 2 中的主动交换更可能发生,这表明工作记忆与主动交换之间存在关联(图 4C)。相比之下,工作记忆与序列学习的平均速度无关(图 4B),这表明初始序列的学习涉及联想机制,而交换则依赖于在工作记忆中对已学结构进行心理操作。与此建议一致的是,重新索引框架假设需要一个临时短期缓冲区来存储待交换的物体,以便重新排列序列的顺序(Tian 等,2024)。更广泛地说,短期记忆缓冲区能够前瞻性规划那些并非物理可见的物品的时间顺序。例如,已有研究表明,非人灵长类动物在需要通过掩蔽序列中的未来物品或比较出现在不同列表中的物品相对排名的任务中表现出前瞻性工作记忆(Beran 等,2004;Inoue 和 Matsuzawa,2009;Treichler 和 Raghanti,2010;Scarf 等,2011;Gazes 等,2012;Templer 等,2019)。我们的研究结果扩展了这些研究,表明通过延迟匹配样本任务测量的更强的工作记忆表现与将物体灵活重新索引到非相邻时间位置的心理能力相关。

序列交换利用了长期记忆

除了工作记忆,我们的结果还表明,当物体关系的序列结构在长期记忆中被更牢固地学习时,主动的心理重新索引更可能发生。受试者在上下文 2 中更可能主动交换物体 B 和 D,前提是他们在上下文 1 中更好地学习了该序列。这一结果表明,主动交换是一种行为策略,只有当序列在记忆中被充分良好地表征时才会变得可用(Jensen 等,2021)。如果对上下文 1 序列的学习较差,受试者同样可能会采用串行推理策略,即在第二序数位置选择相邻的物体 C 而不是物体 D(图 2E)。这一发现扩展了先前的研究,这些研究记录了猴子能够表征(Chen 等,1997;Jensen 等,2019;Mione 等,2020;Ferhat 等,2022;Jensen 等,2022)并长期记忆(Orlov 等,2000;Templer 等,2019)按顺序排列的物品及其相对序数排名。我们的结果与这些先前的发现一致,表明通过链接相邻物体来表征按顺序排列的物体,并了解它们在序列中的相对排名,是非人灵长类动物的一种“默认策略”,只要序列未被足够深入地学习,或者没有任务要求推断出支持非相邻位置心理重新索引操作的更抽象时间结构,这种策略就会被应用。根据这种解释,非人灵长类动物在有足够的经验接触时间结构后,能够推断潜在的时间结构,并不存在从物品序列中推断更复杂时间结构的“硬认知限制”,而不仅仅是表征物品-物品关联的串行链式结构(Dehaene 等,2015;Zhang 等,2022)。

这一结论也得到了前额叶皮层和内侧颞叶皮层神经元的神经生理学证据的支持。在这些脑区中发现了对多物品序列中物品序数排名调谐的神经元反应(Xie 等,2022;Chen 等,2024a;Chen 等,2024b;Shpektor 等,2024)。前额叶的选择性序数神经元反应甚至能够在错误上传物品时预测受试者在每个位置上传的具体物品,尽管这会导致无奖励的选择(Averbeck 和 Lee,2007;Chen 等,2024a)。独立于特定物品的序数位置神经编码原则上支持将物品灵活分配到不同的序数位置,这表明神经表征不仅限于串行的物品-物品关联。

我们推测,我们研究的关键行为结果——非人灵长类动物在已学习的序列中灵活地将物体重新索引到非相邻位置的能力——得益于我们任务设计中的各种特性。首先,在每次行为会话中,非人灵长类动物在训练早期就接触到多个序列对,包括上下文 1 和上下文 2 的交换物品。这一设计确保了交换规则并非罕见的例外任务特征,而是其日常任务环境的组成部分,激励它们找出如何完成上下文 2 中的交换序列以获得奖励。其次,我们的任务范式强制执行了一种“错误后重新触摸最后正确物品”的规则,这确保了错误的串行物体连接不会被忽略,而是立即通过正确的配对进行纠正(见补充视频)。最后,任务范式提供了每项选择的即时表现反馈,形式为光环反馈和滑块进度条的前进或重置(图 1A)。这一设计提供了关于错误选择物品的明确信息,从而促进了学习。

结论

综上所述,我们的结果表明,非人灵长类动物一旦以高熟练度学习了 5 物体序列,就能够灵活地将物体重新索引到非相邻位置。这种心理灵活性表明,当非人灵长类动物参与需要在此结构之上进行心理操作的任务(例如背景变化后所需的物体交换)时,它们会推断其经验的潜在时间结构。这些能力表明,非人灵长类动物形成了非空间的认知地图,并在目标导向行为中利用它们来心理操控物品(Whittington 等,2022)。我们推测,这种心理能力在非人灵长类动物中进化出来,以支持在许多按序列组织的行为中更高水平的行为适应性,而不仅仅是在视觉物体的新时间关系中进行排列(McNamee 等,2021)。

来源:人工智能学家

相关推荐