Nature | 为什么你能快速上手新事物?原来是纹状体pDMSt帮你搞定了“逐次试验更新”

360影视 国产动漫 2025-05-11 18:29 1

摘要:你是否好奇,当我们从零开始学习一项新技能——比如弹奏乐器、掌握一项新的运动技巧,或者甚至是适应一个新游戏的操作方式时,我们的大脑是如何实现那种从磕磕绊绊到行云流水的转变的?是什么力量驱动着我们在一次次尝试中不断进步,直到动作变得如同本能?

你是否好奇,当我们从零开始学习一项新技能——比如弹奏乐器、掌握一项新的运动技巧,或者甚至是适应一个新游戏的操作方式时,我们的大脑是如何实现那种从磕磕绊绊到行云流水的转变的?是什么力量驱动着我们在一次次尝试中不断进步,直到动作变得如同本能?

在大脑深处,有一个被长期认为是感觉与运动“指挥中心”的区域——纹状体(Striatum)。它在我们的行为习惯养成中扮演着重要角色,但对于它究竟是在帮助我们形成新的记忆(学习),还是在帮助我们提取和执行已有的记忆(回忆),科学界一直存在着疑问。同一个脑区,到底是记忆的“设计师”,还是记忆的“使用者”?

5月7日《Nature》的一项最新研究“Striatum supports fast learning but not memory recall”,以光遗传学技术为“探针”,聚焦于纹状体中接收视觉信息的一个特定区域——后内侧纹状体尾部(pDMSt)。研究人员训练小鼠学习将一个特殊的光信号线索与获取食物的抓取动作联系起来。通过精确控制pDMSt的神经活动,他们发现了一个令人惊讶的秘密分工!

结果显示,虽然pDMSt的活动对于促进快速、逐次试验的学习至关重要——抑制它,学习几乎停滞;但一旦小鼠学会了任务,记忆的提取和执行却似乎可以完全独立于pDMSt的活动,无论短期还是长期记忆都是如此。这颠覆了我们对纹状体的一些传统认知,暗示着大脑在学习和记忆过程中存在着精妙的功能迁移。

这个“视觉”纹状体区域,更像是一个高效的“临时教练”,在学习初期不知疲倦地推动行为更新;而记忆本身,则在它的“教练”下,悄悄地搬进了大脑的另一个“档案馆”。

定制“光信号”:创造一个纯粹的视觉线索 (Visual Cue)

以往研究pDMSt对视觉引导行为的贡献,通常使用破坏性的手段,比如损伤 (Lesion) 这个脑区。但损伤的影响是长期且不可逆的,很难区分pDMSt是参与了记忆的形成,还是记忆的提取,更无法探究它在短时记忆 (short-term memory) 和长时记忆 (Long-term memory) 中的具体作用。

为了解决这个问题,研究人员设计了一个精巧的实验范式。他们首先训练小鼠学会用前肢伸入一个槽中抓取食物颗粒 (Food pellet)——这是一个基本的运动技能学习 (Motor skill learning)。这个阶段,小鼠的抓取成功率会随着训练天数的增加而提高。

接下来,他们引入了一个食物预测线索 (Food-predicting cue)。但这个线索不是普通的视觉刺激,而是一个通过光遗传学手段激活小鼠视觉皮层 (Visual Cortex) 特定神经元产生的内部信号。这些神经元被选择性地标记,使其只向pDMSt脑区投射轴突。通过一束蓝光照射小鼠头顶上方视觉皮层对应的区域,研究人员就能精确地、只通过这条皮层-纹状体通路 (Corticostriatal pathway) 将“食物来了”的信号传递到pDMSt,避免了其他视觉通路或感觉线索(如食物气味、声音)的干扰。这种方法的优势在于可以时空精确地控制线索的出现和消失。

通过这种方式,研究人员确保了小鼠学会利用这个“光信号”来指导何时进行前肢抓取,从而从一个基础的运动技能任务,转变为一个视觉线索-运动动作关联学习 (Visual cue-to-action association learning) 任务。

学习效果显著:小鼠真的学会了“看灯抓食物”

实验结果显示,在引入这个光遗传学线索后,小鼠的抓取行为发生了显著变化。随着训练天数的增加,小鼠在光信号出现后立即进行抓取的频率显著提高。在训练了20天后,小鼠在光信号出现后的抓取频率是光信号出现前的四倍以上。

研究人员用一个叫做区分指数 (discriminability index, d') 的指标来量化这种学习效果。d'越高,说明小鼠越能区分在光信号出现后(“线索窗口”)和出现前(“无线索窗口”)的抓取时机。计算发现,随着训练的进行,小鼠的d'值持续上升,反映了关联学习的不断进步。

为了验证小鼠确实是在利用这个光信号作为线索,而不是其他无关因素,研究人员还设置了对照实验:

在部分试验中,光信号出现但不提供食物。小鼠仍然在光信号出现后立即抓取,表明它们确实在响应线索,而非食物本身。

在部分试验中,不出现光信号但提供食物。小鼠此时进行抓取的频率并没有显著高于随机水平,说明它们无法在没有线索的情况下预测食物。

使用了亮度相同但位置不同或时间模式不同的干扰光信号,小鼠不会将其作为预测食物的线索进行抓取。

使用没有表达光敏感蛋白的对照组小鼠,相同的光照射不会引起抓取频率的增加。

这些严格的控制实验有力地证明,小鼠确实学会了将这种由视觉皮层投射到pDMSt的神经元激活信号,与食物的出现建立关联,并以此指导自己的行为。

记忆提取 (Memory Recall):pDMSt表示“已阅,但无需我在场”

接下来,研究人员提出了核心问题:在这个视觉线索-动作关联记忆形成后,当小鼠需要“回忆”并执行这个 learned behavior 时,pDMSt的活动是必需的吗?

为了回答这个问题,他们在已经训练有素(d'≥0.75,抓取时机与光信号高度相关)的小鼠身上,通过光遗传学手段抑制了pDMSt区域中棘神经元 (SPNs) 的活动。SPNs是纹状体主要的输出神经元。他们使用了一种巧妙的方法:在pDMSt区域的抑制性中间神经元 (Inhibitory interneurons) 中表达一个红光激活的抑制性光敏蛋白 (ReaChR),并通过红光照射激活这些中间神经元,从而抑制SPNs的活动。这种抑制是时空精确且可逆的,研究人员只在光信号出现前5毫秒开始,持续1秒钟,在随机选择的一部分试验中进行。

令人惊讶的是,即使在pDMSt的SPNs活动被抑制的情况下,这些训练有素的小鼠仍然能够在光信号出现后正常进行抓取!抑制pDMSt活动没有改变小鼠对线索的检测、抓取动作的启动、抓取成功率,也没有影响任何其他运动学指标。

这个结果表明,一旦视觉线索-动作关联记忆形成并巩固,记忆的提取 (memory recall) 似乎不再需要pDMSt的持续活动。这个 learned behavior 可以被完整地表达出来,即使在pDMSt处于被抑制的状态下。

这引出了一个重要的推论:关联记忆的长期存储和提取,可能依赖于视觉皮层投射神经元的轴突侧支 (axon collaterals) 连接到的其他脑区,而不仅仅是pDMSt。

记忆去哪里了?线索行为的“指挥部”另有他处?

既然pDMSt在recall阶段似乎并非必需,那么这个 learned behavior 的指挥部在哪里呢?研究人员通过进一步的实验,将目光投向了上丘 (Superior Colliculus)。上丘是接受视觉皮层输入的一个脑区,与运动控制密切相关。

他们在训练有素的小鼠上丘区域注射了化学抑制剂 (muscimol),阻断了该脑区的神经活动。结果发现,上丘的抑制显著扰乱了小鼠对光信号线索做出抓取动作的启动 (initiation)(有统计学显著性差异,P=0.00092),但不影响小鼠在没有线索时的自发抓取(无统计学显著性差异,P=0.35)。

这个结果与pDMSt抑制时的现象形成了鲜明对比。它有力地支持了先前的推论:经过学习巩固的视觉线索-动作关联记忆,其提取和执行可能由一条不依赖于pDMSt的通路介导,而这条通路很可能包括上丘。视觉皮层投射到pDMSt的神经元可能通过其轴突侧支连接到上丘或其他脑区,并在记忆巩固后接管了recall的任务。

此外,研究人员还探究了pDMSt对短时记忆 (short-term memory) 的影响。他们观察了小鼠在单次训练会话(大约1小时)中表现出的进步(session-internal improvement),发现每天结束时的d'值平均高于开始时(平均提升0.034,P=0.007)。他们尝试在训练会话的尾声抑制pDMSt活动,看看这是否会影响小鼠对当天已经获得的表现提升的recall。结果发现,会话结束时的pDMSt抑制没有改变当天的d'值提升。这表明,即使是单次训练会话中获得的短时记忆提升,其recall也独立于pDMSt的活动。

快速学习 (Fast Learning):离不开pDMSt这个“临时教练”

如果pDMSt不负责recall,那它的核心功能是什么呢?研究人员的下一个实验直指学习过程本身。他们这次在小鼠从头开始学习视觉线索-动作关联任务的整个训练过程中,在每一次光信号出现时,都对pDMSt的SPNs活动进行1秒钟的抑制。

连续20天的训练后,结果再次让人惊讶:pDMSt被抑制的这组小鼠的学习能力遭到了戏剧性的损害!在训练的第15-20天,对照组小鼠的d'值平均提升了0.77±0.12,而pDMSt抑制组的d'值平均只提升了0.12±0.12。两组之间的差异具有极高的统计学显著性(P=6.2 × 10^-10)。

但这种学习障碍是永久的吗?研究人员在20天后停止了pDMSt的抑制,发现之前被抑制的小鼠重新开始学习,并且在接下来的训练中表现出了明显的进步(到第40天,d'平均提升0.54±0.31)。这说明,pDMSt活动对于学习的必要性是暂时的,而非永久性损伤。

这项结果清晰地表明,pDMSt在小鼠学习阶段扮演着至关重要的角色。它的神经活动,尤其是在线索出现和抓取行为发生的时间窗口附近,对于小鼠学会将光信号与食物关联是必需的。pDMSt就像一个“临时教练”,在学习的早期阶段提供关键的指导。

为了确保这个发现的普遍性,研究人员还在一个自然视觉辨别任务 (Natural visual discrimination task) 中重复了类似的实验。小鼠需要区分一个预测食物的渐变光信号和一个不预测食物的闪烁光信号。pDMSt抑制同样损害了小鼠的辨别学习能力,使它们无法学会只对预测食物的光信号做出抓取反应,而是对两个信号反应相似。然而,一旦小鼠学会了辨别,pDMSt的抑制并不影响它们执行辨别任务。这进一步验证了pDMSt在视觉关联学习中的关键作用,但它主要支持的是学习过程,而非学习成果的表达。

强化学习机制:pDMSt是行为“更新”的关键节点

学习并非盲目尝试,而是一个强化学习 (Reinforcement learning) 的过程,即行为的结果会影响下一次行为的likelihood。如果一个动作产生了好的结果(强化),下次重复这个动作的可能性就增加;如果结果不好(惩罚),下次重复的可能性就降低。这种基于结果的“行为更新”是学习的核心。

这项研究利用了光遗传学任务中大量的试验数据,深入分析了小鼠的逐次试验行为变化 (trial-to-trial behavioral change)。他们考察了连续三次试验(试验 n-1、试验 n、试验 n+1)的行为序列。

结果发现,如果试验 n 中小鼠在光信号出现后成功抓取了食物,那么试验 n+1 中小鼠在光信号出现后立即抓取的频率会显著增加,这就是强化。这种强化是依赖于结果的:如果试验 n 抓取失败,试验 n+1 的抓取频率就不会增加。

更重要的是,这种逐次试验的强化过程需要pDMSt的活动!研究人员发现在试验 n 中,如果在小鼠成功抓取食物的同时或紧随其后抑制pDMSt的活动,那么在试验 n+1 中观察到的行为强化(抓取频率增加)就会消失。而如果在抓取之前抑制pDMSt,则不影响后续的强化。这表明,pDMSt活动在恰当的时机(与行为结果发生时间重叠或紧随其后)对于基于结果的行为更新至关重要。

这种行为更新的特点与强化学习理论高度吻合:pDMSt根据当前行为(抓取)的结果(成功或失败)以及行为发生的情境 (context)(有线索还是无线索),来调整和更新下一次试验中的行为策略。

那么,pDMSt内部的神经元是如何实现这种基于结果和情境的行为更新的呢?研究人员记录了小鼠学习过程中pDMSt内的多巴胺 (Dopamine) 信号以及 putative SPNs(推测是SPNs,因为它们占纹状体神经元的大多数且具有特定电生理特性)的活动。

多巴胺被认为是编码奖励预测误差 (reward prediction error) 的关键信号。研究发现,pDMSt内的多巴胺释放确实与行为结果密切相关:成功抓取食物导致多巴胺信号增加,而抓取失败或未获得食物则导致多巴胺信号下降。这与多巴胺编码行为结果的现有理论一致。

而 SPNs 的活动则更加丰富。研究人员根据SPNs在抓取行为结果发生后(手臂伸展后开始的5秒内)的活动模式,将SPNs分成了两组:

第一组SPNs:在成功抓取后比失败后更活跃。重要的是,它们在有线索的成功后比无线索的成功后更活跃。这说明第一组SPNs偏好有线索的情境和成功的行为结果。

第二组SPNs:在失败后比成功后更活跃。它们在无线索的情境中倾向于被抑制。这说明第二组SPNs偏好无线索的情境和失败的结果。

研究人员通过解码分析 (decoding analysis) 发现,仅凭这两组SPNs在结果发生后的总体活动模式,就能预测当前试验的类型(是有线索的成功、有线索的失败、无线索的成功,还是无线索的失败)。而且,这种关于情境和结果的神经编码在结果发生后的几秒钟内仍然持续存在,而此时小鼠的行为本身已经不包含线索出现时的信息了。

这完美地解释了pDMSt如何支持逐次试验学习:多巴胺信号告知结果的好坏,而SPNs则将行为结果与发生时的情境结合起来进行编码。这种编码整合了“做了什么(抓取)”、“结果如何(成功/失败)”以及“在什么情境下(有/无线索)”的关键信息。这种整合后的神经信号指导了pDMSt输出,进而影响其他脑区,最终决定了下一次试验中,在类似情境下重复特定行为的可能性是否会增加。pDMSt就像一个精密的“算法单元”,接收结果反馈和情境信息,计算出最佳的行为更新策略。

pDMSt是“学习催化剂”,而非“记忆档案馆”

这项研究通过时空高度精确的光遗传学手段,为我们清晰地描绘了纹状体pDMSt在一个视觉线索-动作关联学习任务中的独特功能。它强有力地证明:

pDMSt的活动对于快速、逐次试验的视觉线索-动作关联学习是必需的。抑制pDMSt会阻止基于行为结果(特别是成功)的行为更新,从而阻碍学习进度。

一旦这种关联记忆形成并巩固,其短期 (session-internal) 和长期 (days) 的记忆提取和执行,似乎不再依赖于pDMSt的持续活动。行为可以在pDMSt被抑制的情况下正常进行。

记忆的提取很可能由其他脑区(如视觉皮层投射到的上丘)介导,这些脑区可能通过视觉皮层投射神经元的轴突侧支接收信息。

pDMSt内的多巴胺信号编码行为结果,而SPNs活动则编码行为结果与发生情境的组合。这种编码整合了关键的feedback和context信息,为基于结果的行为更新提供了神经基础。

这项研究为我们理解大脑如何学习新技能提供了重要的洞察。它改变了我们对纹状体的传统认知,即纹状体是记忆的存储地。相反,至少对于pDMSt接收视觉输入区域来说,它更像是一个动态的行为“更新引擎”或“学习催化剂”,负责在学习早期根据试验结果和情境快速调整行为策略。而 learned behavior 本身的“记忆痕迹”,则在学习过程中逐渐转移并存储到其他脑区,由这些脑区负责后续的recall和流畅执行。

这项研究不仅揭示了pDMSt的特定功能,也为我们提供了一个研究大脑不同功能脑区如何协同工作以实现复杂学习过程的典范。未来的研究可以继续探索其他纹状体亚区域以及与pDMSt相关的其他脑区(如上丘、皮层侧支投射区域)在学习和记忆不同阶段的具体作用,从而更全面地理解大脑如何从试错中学习,最终掌握新技能。

所以,下次当你轻松自如地完成一项新学会的技能时,不妨想想,或许你的pDMSt曾经是那个帮你摸索前行、不断纠正错误的“临时教练”,而将这份熟练刻进骨子里的,则是大脑里另外一个“记忆档案馆”。

参考文献

Reinhold K, Iadarola M, Tang S, Chang A, Kuwamoto W, Albanese MA, Sun S, Hakim R, Zimmer J, Wang W, Sabatini BL. Striatum supports fast learning but not memory recall. Nature. 2025 May 7. doi: 10.1038/s41586-025-08969-1. Epub ahead of print. PMID: 40335692.

声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!

往期热文:

来源:生物探索一点号1

相关推荐