摘要:在自然环境中,快速学习能力对动物的生存至关重要。然而,长期以来,研究者们认为动物在学习将感官线索与奖励行为联系起来时,速度非常缓慢。这种缓慢的学习过程被认为与感官皮层中线索表征的逐渐扩展有关。然而,越来越多的证据表明,动物的学习速度可能远超我们的想象,这挑战了
在自然环境中,快速学习能力对动物的生存至关重要。然而,长期以来,研究者们认为动物在学习将感官线索与奖励行为联系起来时,速度非常缓慢。这种缓慢的学习过程被认为与感官皮层中线索表征的逐渐扩展有关。然而,越来越多的证据表明,动物的学习速度可能远超我们的想象,这挑战了传统的感官皮层可塑性模型。
2025年3月19日由美国和英国研究者共同合作在nature发表的文章:“Rapid emergence of latent knowledge in the sensory cortex drives learning”探讨了学习与感觉皮层表征之间的关系。通过训练小鼠进行听觉go/no-go任务,并结合光遗传学和双光子成像技术进行分析。研究表明,听觉皮层(AC)不仅参与感知处理,还执行高级计算,分别驱动快速学习和表现提升。强化反馈虽然关键,但反而掩盖了动物对任务规则的快速掌握。整体而言,该研究重新定义了感觉皮层的基本功能,表明其在学习过程中不仅仅是简单的感官信息处理中心,而是执行更高级别的认知功能。
研究采用瞬时沉默技术来避免替代通路的招募,并通过概率性实验设计区分学习和表现。实验中,研究人员在小鼠整个学习过程中概率性地抑制AC,在90%强化试验中沉默AC(light-on),而10%强化试验(light-off reinforced)和100%探测试验保持AC活动(light-off),以测量AC对学习和表现的影响。研究使用了PV-ChR2双转基因小鼠,并通过双光子钙成像和全视场光遗传刺激验证了抑制的有效性。
结果显示:
· 在light-on强化试验中,PV-ChR2小鼠的表现显著下降,表明AC沉默影响任务表现。
· 在light-off探测试验中,PV-ChR2小鼠的学习能力受损,表现为S+反应学习延迟、辨别能力下降、命中试验中的舔反应潜伏期延长,说明AC对快速习得任务知识至关重要。
· 在light-off强化试验中,PV-ChR2小鼠的准确性仍较低,即使控制其较慢的任务习得速度后,仍存在反应延迟和反应强度降低。
随后,研究进一步探讨了AC在学习过程中是否始终必需,特别是在动物达到专家水平后的作用。研究结果显示随着训练的进展,AC失活的影响逐渐减弱,说明AC在达到专家水平后变得不再必需。研究排除了以下可能性:
1. AC沉默引起分心:视觉皮层沉默未影响表现,AC沉默影响特异性。
2. AC沉默改变音调感知:未增加任务难度。
3. 重复沉默导致损伤:专家水平后AC沉默未影响表现,证明AC不再必需。
图1. 听觉皮层沉默在学习过程中损害了声音引导的学习和表现
研究者还利用低秩张量分解技术,无监督地解析了与学习相关的AC动态变化。通过纵向双光子钙成像,记录了小鼠在听觉go/no-go任务中的神经活动(n=5),并设立被动对照组(n=3),仅暴露于相同音调但无奖励关联,以区分学习相关的神经动态。通过监测数千个兴奋性神经元,研究者试图识别与学习相关的信息,以及在不同试验类型下神经活动的变化。
实验中,研究者使用了遗传编码的钙指标GCaMP6f,针对AC2/3层锥体神经元进行成像。为了区分学习相关的神经动态,研究还对比了学习小鼠和被动暴露音调的小鼠的神经活动。数据分析采用4维张量表示(神经元 × 试验时间 × 训练进程 × 试验结果),并对所有实验小鼠数据进行整合(“超级小鼠”)。通过低秩张量分解,研究无监督地识别出六种独立的神经动态模式,对应不同的AC计算过程。学习网络和被动网络的神经动态几乎是正交的,并且随着学习的进展,神经动态的差异更加显著。此外,研究者根据神经元在各动态中的最大权重,将每种动态与特定的神经元群体相关联。这表明,单个神经元可以参与多种动态计算,并且每种动态对应一个独特的神经元集群。通过这一方法,研究揭示了学习过程中神经活动的多样性和复杂性。
图2. 低秩张量分解揭示了与学习相关的网络动态
研究分析了学习过程中感觉皮层的可塑性,重点关注在学习任务中表现出典型刺激诱发活动的细胞群(细胞群1-4)。研究发现,在被动网络中,长期刺激会引起显著的刺激诱发习惯化,尤其是细胞群1和2(占77%),这两组细胞对不同音调表现出无选择性的激活或抑制反应,且反应强度随时间减弱,反映了对非选择性神经元的广泛抑制。
相比之下,在学习网络中,细胞群3和4表现出高度选择性:
· 细胞群3(19%)对非奖励音(S−)表现出持续选择性,仅有轻微习惯化;
· 细胞群4(12%)对奖励音(S+)表现出持续选择性。
这两个群体比被动网络的细胞群1和2更具音调响应性和选择性,并在整个学习过程中保持其表征。因此,学习通过维持对S+和S−具有选择性的独立细胞群,抵消音调诱发的习惯化,保持对行为相关刺激的表征。
进一步的分析表明,学习并未导致皮层图扩展或调谐变化:
· 学习后,对S+和S−偏好的神经元占据的皮层面积未增加,反而略有减少。
· 对S+和S−反应的神经元比例下降,且反应幅度降低。
· 学习网络更倾向于表征S+和S−之间的频率,而非更高或更低的频率。
为探讨学习网络对刺激选择性的维持,研究通过每日双侧沉默AC进行音调限定性静默。结果发现:
· 音调限定性沉默削弱了任务表现和任务习得能力,特别是在学习初期;
· 随着熟练度提高,影响逐渐减弱;
· 在无强化的光关闭试验中,任务表现未受影响。
这些结果表明,学习通过维持刺激选择性来抵消音调引起的习惯化,并强调音调诱发的神经活动在学习过程中扮演关键角色。
图3. 学习通过维持在不同群体中的刺激选择性,抵消了音调诱发的习惯化
传统观点认为,感觉皮层主要负责感知和解释复杂的感觉信息,但最新研究表明,感觉皮层的神经元也参与编码非感觉变量,如运动、奖励、预期和环境背景,这种共同编码可能增强感知能力或支持高级联想过程。
在学习过程中,研究发现细胞群5、细胞群6在试验后期表现出非典型活动,特别是在音调诱发反应后的延迟信号。随着学习进展,这种信号在成功试验(S+反应)中逐渐增强,并对试验类型具有选择性。细胞群5仅在成功试验中表现出晚期活动,而在正确拒绝(CR)试验中则仅显示经典的刺激诱发反应,且随着学习衰减。
进一步分析表明,这种信号不受以下因素影响:
1. 延迟的感觉活动:信号仅在成功试验中出现,不是感觉刺激的延迟反应。
2. 奖励消耗:在奖励未给出的探测试验中,信号仍然存在。
3. 舔舐行为:舔舐率下降,但信号依然稳定。
因此,该晚期活动被认为是编码 奖励预测信号(RP),并在学习中快速形成,仅需约40次成功试验,神经元便从经典的音调诱发反应转变为奖励预测活动。该信号在学习初期迅速增强,达到表现期时进一步加强,但在专家水平时减弱,表明AC在学习初期至关重要。
研究还发现,FA中也出现奖励预测信号,表明动物错误期望奖励。此外,使用光遗传技术抑制AC后,发现抑制会削弱刺激-行为关联,并延迟线索-反应区分,尤其在S+试验中,而在S−试验中则降低准确性,延长反应时间,影响任务表现。
图4. 奖励预测编码的快速出现推动了学习
在 go/no-go 任务中,成功执行任务的关键是能够抑制对非奖励刺激 (S−)信号的反应。研究发现,小鼠在学习的早期就能抑制对 S− 刺激的舔舐,但在强化试验中仍持续舔舐。研究者探索了AC是否介导这一抑制行为。
在此任务中,AC在抑制反应中起到了重要作用。实验显示,细胞群 6 在小鼠成功抑制舔舐反应时(正确拒绝,CR)表现出明显的晚期活动,且这种活动在训练过程中稳定。
研究进一步验证了这一信号与动作抑制的关系:
1. 在 FA和 CR 试验中,该细胞群的活动在 FA 试验首次舔舐时显著下降,表明该信号在抑制失败时丧失。
2. 该信号仅在 S− 试验的 CR 试验中出现,而不会出现在 S+ 试验的遗漏(miss)试验中,说明其特异性。
3. 在小鼠短暂脱离任务时,该信号显著下降,表明它与任务参与度相关。
为了验证AC的抑制信号是否影响学习过程,研究者使用光遗传技术在 S− 试验期间抑制 AC 网络。抑制AC网络会增加 FA 率并提高舔舐概率,证明这一活动对学习中的任务表现至关重要。
图5. 听觉皮层中的行动抑制信号抑制了舔舐行为
研究者探索了奖励预测和动作抑制神经元群体在AC中的空间分布。通过双光子成像,发现这两种神经元群体在空间上聚集。为了检验这种聚集是否由神经元的学习前刺激选择性驱动,研究者计算了选择性指数(SI),结果发现奖励预测神经元与动作抑制神经元之间在选择性分布上没有显著差异,表明学习前的刺激选择性并不能预测奖励预测或动作抑制的功能。进一步的分析表明,奖励预测神经元与动作抑制神经元的空间分布与音调图谱(tonotopy)无关,即动作抑制神经元与 S− 音调的最佳频率无关,而奖励预测神经元也未特异性响应 S+ 音调。因此,奖励预测和动作抑制的神经元群体在空间上形成了与基础刺激选择性和音调图解耦的高阶功能区分。
图6. 奖励预测和行动抑制信号在分隔的神经群体中出现,并不依赖于基础刺激选择性
总结
研究表明,奖励预测和动作抑制神经群体在听觉皮层中迅速形成,并在行为改进前就开始编码任务条件。这些神经群体与感觉刺激处理无关,表明AC具备更高阶的功能组织。研究进一步提出,感觉皮层应被视为一个感官丰富的联想皮层,它不仅处理感官信息,还能快速进行联想学习,且感觉与联想功能在同一网络内共存,但计算上可分离。研究的结果呼吁对经典的感觉皮层功能观点进行修订,认为其不仅处理感官刺激,还参与任务相关的学习计算。
原文链接:
https://doi.org/10.1038/s41586-025-08730-8
参考文献
Drieu C, Zhu Z, Wang Z, Fuller K, Wang A, Elnozahy S, Kuchibhotla K. Rapid emergence of latent knowledge in the sensory cortex drives learning. Nature. 2025 Mar 19. doi: 10.1038/s41586-025-08730-8. Epub ahead of print. PMID: 40108473.
编译作者:守望者(brainnews创作团队)
校审:Simon(brainnews编辑部)
来源:健康诊疗科