Nature | 突破重复性瓶颈:揭示研究设计对脑全关联研究效应的深远影响

摘要:揭示大脑的奥秘一直是最具挑战却也最具吸引力的课题之一。大脑如何塑造我们的行为、情绪和认知功能?这些问题吸引了无数研究人员投入不懈的研究。而在众多探索工具中,脑全关联研究(Brain-Wide Association Studies, BWAS)凭借其对大脑结构

引言

揭示大脑的奥秘一直是最具挑战却也最具吸引力的课题之一。大脑如何塑造我们的行为、情绪和认知功能?这些问题吸引了无数研究人员投入不懈的研究。而在众多探索工具中,脑全关联研究(Brain-Wide Association Studies, BWAS)凭借其对大脑结构和功能的非侵入性研究方法,成为了解码大脑的关键。然而,尽管BWAS在揭示大脑与行为关系方面发挥了重要作用,其结果的可重复性却常常受到质疑。在样本量不足、研究设计不当的情况下,结论的稳定性和可靠性可能大打折扣。这不仅限制了研究的科学价值,也阻碍了将其应用于个体化医疗和精准神经干预的进程。面对这些挑战,研究人员如何优化研究设计,确保所获得的知识经得起时间和方法论的考验,成为了当下亟待解决的问题。11月27日Nature的研究报道“Study design features increase replicability in brain-wide association studies”,从不同研究设计的角度出发,深入探讨如何通过优化样本量、采样方案以及纵向设计,提升BWAS的效应大小和可重复性。

脑全关联研究(Brain-Wide Association Studies, BWAS)通过磁共振成像(MRI)等非侵入性技术,研究个体行为、认知以及生物学差异与大脑结构或功能之间的关联。近年来,BWAS在揭示大脑与行为关系方面发挥了重要作用。然而,科学界对BWAS结果的可重复性(replicability)提出了质疑,特别是在样本量不足或研究设计不合理的情况下,研究结果的可靠性受到严重影响。

BWAS的核心目标是明确大脑结构和功能与个体健康状态之间的真实生物学关联。然而,如何确保研究结果的可重复性仍是研究者面临的关键挑战之一。可重复性指的是在不同研究中能够获得一致的假设检验结果,而它依赖于样本量及标准化效应大小(Standardized Effect Size)。效应大小通常受效应在总体中的强度和研究设计的影响,例如皮尔逊相关系数(Pearson's correlation)或科恩d值(Cohen's d)。由于样本量有限,许多BWAS研究的可重复性未能达到预期标准。因此,该研究旨在通过对比不同研究设计策略,提出优化方案,以增加效应大小并提高BWAS的可重复性。

近年来,已有研究证实,数千名参与者的样本量是实现BWAS结果可重复性的必要条件。例如,UK Biobank数据集包含超过5万名参与者的数据,而青少年大脑与认知发展研究(ABCD)则包括近1万名儿童的长期追踪数据,这些大型样本量显著提高了研究结果的可靠性。然而,增加样本量往往受到时间和资金的限制。因此,除了增加样本量,优化研究设计成为提升效应大小和可重复性的关键策略。

该研究分析了来自63个纵向与横断面MRI研究的数据,总共涉及77,695次扫描。这些数据来源于“生命历程大脑图表联盟”(Lifespan Brain Chart Consortium, LBCC),并结合了UK Biobank、阿尔茨海默病神经影像计划(ADNI)及ABCD等多项大型数据资源。通过对年龄、性别、认知水平与疾病等协变量与大脑结构和功能之间关联的分析,研究人员发现,某些设计特征对标准化效应大小有显著影响。

在许多情况下,样本量不足的研究存在显著的统计功效问题,这会导致低估效应大小并影响结果的可重复性。例如,研究显示,当样本量少于500人时,效应大小可能仅为真实效应的50%左右,这使得后续研究难以获得一致的验证结果。因此,较大的样本量对于提高研究结果的稳定性和可靠性至关重要。

不同研究设计特征与大脑不同度量指标之间的标准化效应大小(Standardized Effect Size)之间的关系,特别是年龄与大脑结构的关联(Credit:Nature

图a–d,关于年龄与全脑指标(全脑灰质体积(GMV)、全脑标准化灰质体积(sGMV)、全脑白质体积(WMV)和平均皮层厚度(CT))之间关系的元分析结果。通过部分回归图(Partial Regression Plots),显示了不同研究设计特征对标准化效应大小(RESI)变化的影响。

图e和f,研究设计特征如何影响标准化效应大小,特别是在年龄与大脑局部区域(如局部灰质体积(regional GMV)和局部皮层厚度(regional cortical thickness))之间的关联。

纵向设计与横断面设计是神经科学研究中的两种重要方法。纵向设计通过跟踪同一批参与者在不同时期的变化,能够更准确地评估个体内的动态变化,从而有效减少个体间的随机噪声。而横断面设计则只反映某一时点上的群体差异,通常适用于大样本研究,但容易受到个体间差异的影响。

在全脑灰质体积(Total Grey Matter Volume, GMV)的分析中,研究表明,纵向设计的研究效应大小显著高于横断面设计。例如,在控制其他协变量后,纵向研究中GMV与年龄的关联效应大小平均为0.39,而横断面研究仅为0.08,这表明纵向设计能将标准化效应大小提高380%以上。针对总皮层厚度(Mean Cortical Thickness),纵向设计的效应大小为0.30,而横断面设计仅为0.05。白质体积(White Matter Volume, WMV)也呈现类似趋势,纵向设计显示出更高的效应大小。

通过引入多时间点的重复检测,纵向设计能够更加准确地捕捉个体内的变化趋势,从而有效降低个体间差异对结果的影响。例如,针对1,500名参与者的研究显示,纵向设计相比于横断面设计,能够将评估精度提升40%,显著降低个体差异带来的统计噪音。这些数据有力地支持了纵向设计在提升效应大小方面的有效性。

纵向设计的另一显著优势是能够区分个体内变化和个体间差异。个体内变化的追踪有助于揭示大脑发育和老化过程中的真实动态变化,而这些信息往往在横断面设计中被个体间的随机差异所掩盖。例如,在一项持续5年的追踪研究中,涉及超过2,000名参与者的数据表明,纵向设计能够揭示与大脑萎缩速率有关的重要生物标记,这些标记与老年痴呆症的风险显著相关。

然而,纵向设计并非在所有情况下都优于横断面设计。例如,对于不随时间变化的特征(如性别),纵向设计并不能显著增加效应大小。此外,如果模型中错误地将个体内和个体间变化混为一谈,可能会导致效应的低估,进而降低结果的可重复性。同时,纵向设计的高成本及参与者流失问题也为研究带来了挑战,因此需要在研究设计阶段予以充分考虑。

研究设计中的采样方案是影响效应大小和结果可靠性的重要因素。该研究通过对UK Biobank数据集中三种不同采样方案(正态分布、均匀分布、U形分布)进行比较,探讨了采样变异性对标准化效应大小的影响。结果显示,U形采样方案通常能获得最大的标准化效应大小,并显著提高研究结果的可重复性。

例如,对于全脑灰质体积与年龄之间的关联,U形采样方案相比正态分布采样能够增加60%的效应大小,相比均匀分布采样增加27%。具体数据显示,使用U形采样方案时,达到80%可重复性所需的样本量仅为100名参与者,而正态分布方案下则需要约200名参与者。通过优化采样方案,研究人员可以有效降低样本量需求,从而提高研究的时间和成本效率。

进一步比较了不同采样方案对其他协变量(如BMI、教育水平等)的影响,结果显示,U形采样在大多数协变量的标准化效应大小方面均表现出显著优势,尤其是在与认知功能相关的变量上,效应大小提高了35%。这些结果进一步表明,优化采样方案在提高研究结果的可靠性和效应大小方面至关重要。

此外,研究还探讨了采样变异性对小样本研究的影响。研究发现,对于样本量在200人以下的小型研究,U形采样的优势尤为明显,可将效应大小提高约50%,使得小样本研究结果更具统计学意义。这为资源有限的小规模研究提供了有效的采样策略选择。

在英国生物银行(UKB)研究中,三种不同的采样方案下,年龄与大脑不同度量之间的标准化效应大小和可重复性的变化(Credit:Nature

采样方案与年龄分布

分析了三种不同的采样方案在UKB研究中的应用,这些采样方案目标是增加样本中年龄的变异性,以提高研究效应的强度和结果的可重复性。这三种采样方案的年龄分布特征分别为:

钟形分布(Bell-shaped):最接近正态分布,年龄集中在中间范围,年龄变异性较小。

均匀分布(Uniform):各年龄段均衡分布,年龄变异性较高。

U形分布(U-shaped):样本中包含更多极端年龄段(年轻和年老个体),这使得年龄的变异性最高。

标准化效应大小增加(图a):在全脑灰质体积(Total GMV)和年龄的关联中,随着年龄变异性的增加(从钟形分布到U形分布),标准化效应大小显著增加。这说明,采样方案中包含更多的年龄变异性可以使得效应更明显,增加了年龄对大脑结构影响的可观测性。

可重复性增加(图b):类似地,可重复性(在显著性水平为0.05下)随着采样方案中年龄变异性的增加而提高。这意味着U形分布下的采样方案不仅提升了效应大小,还显著提高了结果在不同重复实验中的稳定性和可验证性。

区域灰质体积和皮层厚度(图c–f):对于局部大脑区域的灰质体积(Regional GMV)和皮层厚度(Cortical Thickness),同样的趋势也得到了验证。随着年龄分布变异性的增加(从钟形分布到U形分布),标准化效应大小(图c、图e)和可重复性(图d、图f)均显著提升。

平均效应大小与可重复性:图中的粗线代表在所有显著未校正效应的区域中,使用整个UKB数据集所得到的平均标准化效应大小或估计的可重复性。可以看出,在不同采样方案下,包含更高年龄变异性的采样(如U形分布)使得在局部大脑区域中的效应更加显著和可重复。

为了进一步探讨采样变异性的影响,研究人员对ADNI数据集中的纵向采样进行了详细分析。通过调整参与者之间和个体内年龄的变异性,结果表明,增加这些变异性可以显著提高效应大小和可重复性。在每个参与者进行了两次检测(基线和随访)的情况下,U形采样相较于正态分布方案使标准化效应大小增加了23.6%。

增加参与者的检测次数同样对效应大小的提高具有显著作用。例如,基线之后增加一次检测,可以将全脑灰质体积与年龄之间的效应大小提高156%,并使可重复性提高350%。在一项涉及500名参与者的连续3次检测的实验中,增加检测次数有效降低了个体内变化的评估误差达20%,使整体效应大小增加了接近两倍。这些发现表明,纵向设计中增加检测次数是提升研究可靠性和效应大小的重要策略

此外,增加检测次数不仅提升了效应大小,还能捕捉更加细微的大脑变化动态。例如,一项关于青少年大脑发育的研究表明,通过对600名青少年进行5次纵向检测,可以有效识别出早期大脑结构变化与后期认知功能发展之间的潜在关联,而这些细微的动态关联在单次或双次检测中往往难以检测到。因此,增加检测次数对于理解大脑的复杂变化过程具有重要意义。

基于上述研究结果,优化BWAS的研究设计对于提高效应大小和可重复性至关重要。以下是一些可行的优化设计建议:

增加采样变异性:通过采用极端群体(Extreme Group)和两阶段(Two-Phase)采样方案,可以显著增加协变量的标准差,从而提高效应大小和研究效率。优先选择在认知或行为测试中得分较高或较低的个体进行大脑扫描,是一种能够更好捕捉变量之间关联的有效策略。例如,一项对800名参与者的研究显示,极端群体采样方案能够将效应大小提高约50%。此外,对于特定的临床群体(如认知能力显著下降的老年人群),采用极端采样策略可以更容易地发现关键的脑生物标记。

准确建模纵向效应:在纵向研究中,确保模型能够分别估计个体间和个体内效应至关重要。如果这两种效应在模型中被简单平均,可能会导致效应大小的低估。通过使用分层线性模型(Hierarchical Linear Model, HLM),研究人员可以精确区分个体间与个体内的效应,从而使得效应大小增加30%以上。此外,贝叶斯模型(Bayesian Models)也可以用于纵向研究,以更好地捕捉个体的变化路径和不确定性,尤其在样本量较小时尤为有效。

平衡样本量与设计特征:虽然增加样本量是设计研究的重要策略,但该研究表明,优化设计特征(如采样变异性和纵向设计)同样能显著提高标准化效应大小和可重复性。在一项模拟研究中,研究人员发现,通过优化采样和设计方案,即便样本量减少一半,效应大小和可重复性也能与传统设计中使用完整样本量的效果相当。这对资源有限的研究项目尤为重要。在实际应用中,可以通过合理分配样本量与检测次数,达到最优的效应大小和资源利用效率。

脑全关联研究在理解大脑功能与行为之间的复杂关系中具有不可替代的作用。然而,由于样本量和研究设计的限制,其结果的可重复性常受到质疑。该研究通过分析不同的研究设计特征,发现优化采样方案和合理的纵向设计可以显著提高效应大小,从而增强BWAS的可重复性。未来的研究应更加注重设计优化,以最大化数据的使用效率,推动神经科学的进一步发展。

综上,通过对纵向设计与横断面设计的对比,优化采样方案,以及增加检测次数等手段,可以有效提高脑全关联研究的效应大小和结果的可重复性。这为未来的神经科学研究提供了重要的指导,尤其是在资源受限的情境下,如何通过科学的研究设计获得可靠且可重复的研究成果。进一步的研究应注重多维度的协变量控制和多次重复检测的应用,以更全面地揭示大脑结构与功能之间的复杂关系,推动个体化医学和神经科学的前沿发展。

参考文献

Kang, K., Seidlitz, J., Bethlehem, R.A.I. et al. Study design features increase replicability in brain-wide association studies. Nature (2024). https://doi.org/10.1038/s41586-024-08260-9

责编|探索君

排版|探索君

转载请注明来源于【生物探索】

声明:本文仅用于分享,不代表平台立场,如涉及版权等问题,请尽快联系我们,我们第一时间更正,谢谢!

来源:欢欢说科学

相关推荐