摘要:人类大脑是最复杂的器官之一,它控制着思维、情感、行为和生理功能。然而,要真正理解大脑的工作原理,研究人员需要能够精确绘制神经元的分布、连接和活动模式。近年来,光片荧光显微镜(light-sheet fluorescence microscopy, LSFM)技
引言
人类大脑是最复杂的器官之一,它控制着思维、情感、行为和生理功能。然而,要真正理解大脑的工作原理,研究人员需要能够精确绘制神经元的分布、连接和活动模式。近年来,光片荧光显微镜(light-sheet fluorescence microscopy, LSFM)技术的兴起,使得研究人员可以在整个大脑范围内,以单细胞分辨率观察神经元的形态和活动。这项技术极大地推动了神经科学的发展,但同时也带来了一个巨大的挑战——如何处理和分析这些包含数万亿体素(teravoxel-scale)的超大规模数据?
传统的神经元分析方法通常依赖于脑图谱(brain atlas)进行比对,或者通过手动标注特定的脑区来研究神经元活动。然而,这些方法存在局限性:脑图谱是基于平均大脑模型构建的,无法精确解析个体之间的微观差异;而手动标注不仅耗时,而且容易受到主观偏见的影响。因此,研究人员迫切需要一种自动化、通用化的方法,来精准、客观地分析三维大脑数据,并识别局部的神经元群体活动。
在这一背景下,1月27日Nature Methods的研究报道“A deep learning pipeline for three-dimensional brain-wide mapping of local neuronal ensembles in teravoxel light-sheet microscopy”,这一创新性的研究提出了一种基于人工智能(artificial intelligence, AI)的神经元群体绘图方法——ACE(artificial intelligence-based cartography of ensembles)。这是一种端到端的深度学习(deep learning, DL)pipeline,能够自动分析LSFM数据,精准地分割神经元、评估其不确定性,并利用统计算法识别不同脑区的神经元活动模式。相比于现有的图像处理方法,ACE具备更高的泛化能力,可以跨不同实验和数据集进行神经元分析,提供更加细致和可靠的结果。
该研究不仅展示了ACE在多个神经科学应用中的卓越表现,还通过冷诱导食物觅食实验和运动实验,证明了ACE能够揭示以往难以检测的局部神经元活动模式。这项突破性的技术为神经科学研究提供了一种强大的新工具,未来或将在脑功能解析、神经疾病研究以及脑机接口(brain-computer interface, BCI)等领域发挥重要作用。
揭开大脑的神秘面纱:为什么神经元活动的精准测绘如此重要?
大脑是已知最复杂的信息处理系统,拥有约860亿个神经元(neurons),每个神经元可以与数千个其他神经元相连接,形成一个由数百万亿突触(synapses)构成的庞大网络。这种网络不仅支持感知、运动和记忆的基本功能,还塑造了个体的情绪、决策和创造力。
要理解大脑的工作方式,研究人员需要追踪神经元在不同状态下的活动模式,比如当个体处于压力状态、学习新技能或经历情绪波动时,不同脑区的神经元群体如何协同工作。然而,面对如此复杂的系统,仅仅研究单个神经元或局部脑区的活动显然是不够的,研究人员需要一种可以在整个大脑范围内,以高分辨率解析神经元活动的方法。
光片荧光显微镜(light-sheet fluorescence microscopy, LSFM)技术的出现为全脑成像带来了革命性的进展,它可以一次性采集完整大脑的三维图像,提供单细胞(Cellular-resolution)级别的结构和功能数据。但与此同时,LSFM数据的规模也极为庞大,一个实验产生的数据可达数万亿体素(teravoxel scale),远超传统图像处理方法的承载能力。如何在这样的超大规模数据中,准确定位并解析神经元活动,成为神经科学研究的一大挑战。
神经元活动与认知行为:解码大脑的运行机制
大脑的运作依赖于神经元的精确放电(firing)和神经网络的协同活动。例如,当我们伸手触碰物体时,感觉皮层(somatosensory cortex)的神经元会瞬间活跃,将触觉信号传递到大脑的相关区域进行处理;当我们面对复杂决策时,前额叶皮层(prefrontal cortex)的神经元会动态调整其连接模式,权衡不同选项的利弊。这些过程都是在庞大的神经网络中实时发生的,而传统的研究方法往往难以捕捉这些瞬时且局部的变化。
传统研究方法的局限性:为什么我们需要新的工具?
尽管神经科学家已经开发了许多研究神经元活动的方法,但传统的方法仍然存在许多局限性,使得研究人员无法全面解析大脑的神经活动模式。
依赖脑图谱,难以精准解析个体差异:目前,很多神经科学研究依赖于标准脑图谱(brain atlas),例如Allen Mouse Brain Reference Atlas(ARA),来定义大脑不同区域的神经活动。然而,脑图谱是基于多个样本的平均数据构建的,它无法准确反映个体之间的微观差异。
传统方法依赖人工干预,分析效率低下:以往的神经元检测方法,如Ilastik或Cellfinder,通常依赖于手动参数调整或专家标注,这种方法既耗时又容易受主观偏见的影响。
统计分析受限,难以发现隐藏的局部变化:在全脑数据的分析中,研究人员通常使用体素(voxel)统计或ROI分析方法。然而,这些方法要么对单个体素进行独立统计,要么在一个大脑区域内进行平均计算,导致许多局部的重要神经活动模式被忽略。
从显微镜到大数据:如何观察整个大脑的神经元活动?
大脑的复杂性使得研究人员不仅要观察单个神经元的活动,还必须理解它们在整个大脑中的分布和相互作用。要做到这一点,研究人员需要既能覆盖全脑范围,又能提供单细胞分辨率的成像技术。光片荧光显微镜(light-sheet fluorescence microscopy, LSFM)的出现,使得全脑神经元成像成为可能,但与此同时,也带来了数据分析上的巨大挑战。
光片荧光显微镜(LSFM):解锁全脑神经元活动的关键技术
传统的神经科学研究依赖于薄片切片和二维显微镜成像,虽然可以提供细胞级别的信息,但往往难以保持三维组织结构的完整性。LSFM是一种革命性的成像技术,它能够对整个大脑进行快速成像,并提供单细胞分辨率,从而让研究人员能够在完整的三维环境中研究神经元活动。
LSFM的核心优势:
大视野高分辨率:能够以单细胞(cellular-resolution)级别获取完整的三维脑组织数据,避免了传统显微镜因样本切片导致的信息丢失。
成像速度快:相比共聚焦显微镜,LSFM使用片状激光照明样本,能在短时间内完成整个大脑的成像,大幅提高了数据采集效率。
适用于透明化样本:结合组织透明化技术(如CLARITY、iDISCO等),LSFM能够在不破坏组织结构的情况下,直接对整个大脑进行成像,保留神经元网络的完整性。
该研究使用LSFM对18只Tg TRAP2-Ai9转基因小鼠进行全脑成像,并重点关注c-Fos标记的神经元活性。研究人员采集了大量三维(3D)影像数据,并将其划分为每个体素大小约0.35 mm³的子图像(patches),以便进行后续分析。然而,这些数据的体量之大,远远超出了传统数据分析工具的承载能力。
LSFM虽然解决了全脑成像的问题,但它带来的海量数据也成为了神经科学研究的一大障碍。一个完整的大脑成像数据可达到数万亿体素(teravoxel scale),其数据量可达TB级甚至PB级,远远超过传统计算机视觉方法的处理能力。
研究人员在该研究中面对的核心数据挑战包括:
数据规模过大,传统分析方法难以处理
以往的显微镜数据通常在GB级别,但LSFM产生的数据量是其数百甚至上千倍。
例如,ACE pipeline在训练过程中使用了15,200个3D图像patches,总数据量远超普通机器学习任务,导致传统方法(如手动标注和传统图像分割算法)根本无法有效应对。
神经元形态多样,单纯依赖传统算法难以泛化
不同脑区的神经元在形态、密度和信号强度上存在巨大差异,传统基于阈值或形态学特征的分割方法(如Ilastik、Cellfinder)在不同实验条件下泛化能力较差。
研究团队发现,在低信号或模糊区域,这些传统方法容易出现高误检率(false positives)或遗漏神经元(false negatives),从而影响研究结论的可靠性。
分析方法必须适应不同实验室、不同扫描参数的数据
由于LSFM数据的获取方式可能因实验室、显微镜参数和样本处理方法的不同而有所变化,导致数据之间的信号噪声比(SNR)、对比度(contrast)和光学畸变(optical artifacts)存在显著差异。
研究人员发现,传统方法在训练数据上表现良好,但在未见过的数据(unseen datasets)上,性能大幅下降,难以满足科学研究的需求。
ACE(Artificial Intelligence-based Cartography of Ensembles):突破神经科学测绘的AI新工具
为了解决上述问题,研究团队开发了一种基于人工智能(AI)的神经元绘图方法——ACE(Artificial intelligence-based Cartography of Ensembles)。这一端到端(end-to-end)的深度学习(deep learning, DL)pipeline,专为LSFM数据而设计,能够精准、高效、自动化地检测和分析全脑神经元活动。
ACE的核心创新点:
端到端的深度学习pipeline——无需手动调整参数,即可全自动完成神经元检测和分割。
结合两种先进的AI架构,提升神经元识别精准度:视觉变换器(Vision Transformer, ViT)——能有效解析神经元在复杂三维空间中的分布模式。
三维U-Net(3D U-Net)——专为医学和生物影像处理优化,精准分割神经元。
采用不确定性评估(Uncertainty Estimation),确保检测的可靠性。
超强泛化能力——ACE经过不同实验环境和数据集的严格测试,适用于多种成像和实验条件。
ACE的核心原理:AI如何精准识别神经元?
深度学习驱动的端到端pipeline
在传统神经元分析方法中,研究人员通常需要进行多个步骤的手动干预,比如图像预处理、阈值设定、手动调整参数等。这不仅耗时,还容易引入人为误差。ACE采用端到端深度学习方法,完全摆脱了手动调整参数的需求,它能够直接从LSFM数据输入,自动完成神经元分割、特征提取、统计分析等多个步骤,大幅提高效率和准确性。
ViT+3D U-Net双引擎,提升分割精准度
ACE的核心在于结合两种先进的AI架构,最大程度提高神经元识别的精准度。
视觉变换器(Vision Transformer, ViT)ViT最初用于自然图像分析,现在被用于三维神经元检测。它通过自注意力机制(self-attention),能够在大范围内建立神经元之间的空间关系,有效捕捉神经元在复杂三维结构中的层级分布。
三维U-Net(3D U-Net)传统的U-Net在二维显微镜数据上表现优异,而ACE采用的是专门针对三维数据优化的3D U-Net。
3D U-Net能够学习神经元的空间结构,对形态复杂、信号微弱的神经元进行精准分割。
在ACE的架构中,ViT和3D U-Net相互配合,ViT捕捉全局特征,3D U-Net进行局部精细化分割,最终生成高精度的神经元检测结果。
实验数据显示,ACE的Dice相似性系数(DSC)比传统方法提高0.17,在不同数据集上的泛化能力远远超过现有的分析工具。
不确定性评估:AI如何自我检测准确性?
一个重要的问题是:AI如何知道自己识别的神经元是否准确?ACE通过不确定性评估(uncertainty estimation)解决了这个问题。
研究人员使用蒙特卡洛Dropout(Monte Carlo Dropout)技术,让ACE在同一张图像上进行多次预测,并计算不同预测之间的方差。
结果表明,当ACE对某些神经元的识别存在不确定性时,该区域往往也是人类专家难以分辨的区域,比如神经元边界模糊或信号强度较低的地方。
研究团队利用这一点来优化ACE的表现,确保最终的神经元检测结果更具可信度。
实验表明,相比传统方法,ACE在低信号或模糊区域的神经元识别准确率更高,误检率更低。
ACE(Artificial intelligence-based Cartography of Ensembles)在全脑范围内神经元胞体分割任务中的性能表现(Credit:Nature Methods)
(a) 全脑c-Fos表达的最大强度投影渲染图
图中展示了全脑范围内c-Fos表达的三维图像,并放大显示了一个皮层局部区域(cortical patch)。在放大的子区域中,
来源:生物探索